研究テーマ
バイオデータベースのXML標準形式の設計とXMLデータ検索システムの開発
公共データベースの自動更新システムの開発
公共データベースのXML変換システムの開発
「バイオインフォマティクス」という言葉に代表されるように、情報科学のライフサイエンス分野での展開が期待されている。バイオ関連、特にゲノム情報に関するデータベースは全世界に500件以上あり、ネットワークを通じてこれまでは独立に管理・運営されていたデータベース間で情報を共有し、共同研究できる下地ができてきた。
しかし、現状のバイオ関連データベースを相互に連携させるには次のような問題がある。
  • データベースごとのフォーマットの異種性
  • 常に最新データが必要だが、各データベースの容量が大量かつ更新頻度が高い→物理的な統合データベース構築による解決には限界がある。
本グループではグリッド技術を用いてマルチスケールデータベースの連携を図り、バイオデータ活用のための基盤技術開発に取り組んでいる。


▲データグリッドによるデータベース連携
1.データベースフォーマットの異種性の解消―XML標準形式の設計
Web上で公開されているバイオデータベースはフラットファイル形式からXML形式になってきている。しかし、各データベースのフォーマットはデータベースごとに固有の書式となっており、同じ蛋白質についてのデータであっても記述がまちまちである。例えば糖の一種であるリボースに結合する蛋白質RbsBについてのデータは、DDBJ、SWISS-PROT、PDBではデータベース書式が図のように異種性に富む。
▼データベース書式の異種性
2.公共データベースのXML変換システムの開発
これらスキーマの異なるXMLを変換定義規則に基づいてXML標準形式ファイルへ変換し、表示する機能を研究している。(大阪大学情報科学研究科大川助教授/アズテックシステム)

3.ネットワーク上でのXMLデータ検索システムの開発
また、データベースをネットワーク上で広域分散させたまま(データベース管理機関の自主性を生かしたまま)シームレスな検索を実現するため、SOAPなどWebの仕掛けを利用して仮想的に統合し、データベースのサービスをXML規格の中で利用可能なものにするグリッドデータベース基盤システムのプロトタイプを開発中である。(日立ソフトウェアエンジニアリング)

4.公共データベースの自動更新システムの開発
1日平均1500万塩基の割合で新規のデータが蓄積され、しかも最新データへの網羅的なアクセスが研究の成否に直結するため、BLAST等の一種の全文検索を効率的に行うために公共データベースのローカルコピーを持ち自動更新を行う技術を開発している。(大阪大学遺伝情報実験センター安永教授/日本ヒューレットパッカード)

5.検索用配列分類データベースシステムの開発
バイオデータベースでは、急激なデータ量の増大だけでなく、特定の種類の配列データ(例えばHIVの蛋白質分解酵素の配列)が大量に登録されることなどによる冗長性の増加や、ドラフト配列などの読み取り精度の低い断片データの大量登録によるデータ品質の低下が問題となっている。そこで、次の2つの方法によりこれらの問題の解消を目指したシステムを開発。
  1. データベース中の配列データに対してあらかじめ総当りで比較を行い、それをもとにデータベースの検索結果を動的に階層化することにより、検索結果の冗長性を削減する。
  2. 専門家により構築された品質の高いデータベースの情報(2次情報)を出力結果に付加することによって、より精度の高い情報のブラウジングを可能にする。(京都大学化学研究所バイオインフォマティクスセンター藤教授/三菱スペースソフトウェア)

6. 高次の情報検索システム:ADME情報XMLデータベースシステム
創薬で重要な、ADME(薬物の吸収・分布・代謝・排出)の情報をXMLで表現し、同様にXMLで表現された遺伝子・蛋白質や、化合物の情報との間にリンクを張ることで、蛋白質と化合物間の結合強度の情報と薬物代謝の情報との関連など高次の情報検索が行えるシステムを構築する。(富士通九州システムエンジニアリング)

7.既存のウェブサービスとの連携:XMLレイヤーの設計
実際に運用されているデータベースシステムに対して、最小限のカスタマイズで仮想的に統合(XML化してグリッド化)させるシステムを開発中である。(蛋白質研究奨励会)
このシステムの開発により、データベース提供側には次の2つのメリットがある。
  1. データベースの全データのコピーを提供しなくてすむ→コピーの更新を考える必要がない
  2. 部分的なアクセス制限をかけることで、サービスのレベル分けができる→ビジネス展開

  1. データグリッド基盤システムの完成
  2. さらに多様なデータベース結合
  3. コンピューティンググリッドとの連携―シミュレーション結果のデータベース化

| Top | プロジェクト概要 | 研究内容 | 公開資料 | イベント | リンク |
     Copyright(c) Cybermedia Center, Osaka University