バイオリソース研究センター(BRC)統合情報開発室
世界最大級のバイオリソースと情報でバイオ研究の水先案内人となる
バイオ研究に欠かせない研究資源、バイオリソース。理研バイオリソース研究センター(理研BRC)では世界で最大数のバイオリソースを管理し、提供しています。バイオリソースを最大限に活用するために重要なのが、そのリソースに関する情報の整備です。私はバイオリソースと情報の相乗効果を最大化するための研究をしています。
理研BRCとは
理研BRCが扱うバイオリソースはマウス(約9,500系統)、植物(約84万株・クローン)、細胞(約17,000株)、遺伝子(約380万クローン)、微生物(約3万株)の5種類です。世界的にも、個体から細胞、遺伝子まで、生命の複数の階層にわたってバイリソースを扱う機関他になく、理研BRCが扱うバイオリソース数は世界一です。
ヒトの体質がみな異なるように、生物は多様です。しかし、研究に使うバイオリソースが多様では、研究の再現性がなくなってしまい、科学として成立しません。ですから、標準となるバイオリソースが必要なのです。変異したりしないように品質を厳重に管理することもバイオリソースセンターの重要な使命です。
情報がなければバイオリソースは生かしきれない
私たち、統合情報開発室のメンバーは、生物学や情報学を専攻し、バイオインフォマティクスやオントロジーの専門家として日々研究しています。私たちは、世界中のバイオリソースセンターが発信するデータと連携・統合するために、国際標準として定められた技術で情報を整備し、公開しています。
その手法の一つがRDF(Resource Description Framework)です。RDFは、「Webを一つの大きな知識データベースにする」という目的のために考案された情報記述に関する国際標準形式です。たとえば、バイオリソースを説明する文章は主語+述語+目的語を必ず入れるというルールがあります。その目的語を主語とした記述を続け、詳細情報を付加していきます。文章に使用する語句もオントロジーに配慮して細かく定められています。こういったルールは、コンピュータがWeb上に分散している情報を自動的に関連づけ、データベースを常にアップデートしていくための工夫なのです。
こうした取り組みの恩恵を受け、理研BRCは世界のデータベースと連携しています。たとえば、スイスバイオインフォマティクス研究所(Swiss Institute of Bioinfomatics : SIB)が提供する、生物種を超えた遺伝子の相同性のデータを理研BRCに統合しています。理研BRCが提供するデータもまた、世界中で整備が進むバイオデータベースの一角を担っています。
理研BRCでは、バイオリソースと疾患情報との関連付けにも力を入れており、表現型にまつわる情報もバイオリソースに紐づけています(図1)。「マウスにある表現型が見られたら、この病気」というように、表現型は病気とつながっている場合が多いのです。
こういった情報をいかに見せるか、ユーザーインターフェイスにも工夫を凝らしています。理研BRCのトップページの左上にある検索窓から、理研BRCで扱う全てのバイオリソースにまつわる情報を検索できます。検索結果はリソース名、病名、遺伝子別に見やすく表示しています。病名を入力して検索することも可能です。ユーザーの方から「疾患との関連性も分かって研究テーマが広がった」「5種のリソースを横断して検索ができ、効率がよかった」という喜びの声をいただいています。
今後は、理研オープンライフサイエンスプラットフォーム(OLSP)で扱う画像データベースや脳のデータベースなどの情報もRDFで連携させていきたいです。また、AIを活用して、Web上にある関連データを自動的に連携していくことも考えています。こうして情報を有機的につなげてくことで、「データの生態系」ができていくという姿を思い描いています。
バイオリソースや情報の寄託・譲渡を
理研BRCの利用法は、研究者の皆様がバイオリソースの提供を受けるだけではありません。研究者の皆様が創出したバイオリソースや情報の寄託や譲渡もしていただけます。
研究者個人がバイオリソースの管理をして研究者間での授受をしていると、いつのまにか消失して入手不可能になったり、入れ替わったりといった間違いが起こりがちです。理研BRCに寄託・譲渡していただければ、品質を管理して、世界とつながる形式で情報を発信します。世界中の研究者に皆様の研究をつなぐためにも、ぜひ、理研BRCにバイオリソースを寄託・譲渡していただけたらと望んでいます。
また、バイオリソースを使用した研究で得られた情報も提供していただけると嬉しいです。分野によっては、論文中に記述するバイオリソース名が不明瞭な場合もあり、当事者でない私たちがバイオリソースと情報をつなげることができない場合もあるからです。
情報からバイオリソースを提案したい
これまでの私たちの取り組みは、バイオリソースに付随する情報を整備するという方向でした。新たな取り組みとして、今後は、情報からバイオリソースをつくるという方向の研究もしていきたいと考えています(図2)。
理研BRCはバイオリソースを提供すると同時に、情報を提供する情報センターでもあります。加えて、文献データベースやDNA配列ライブラリーなどの膨大なデータと効率的に連携するための情報収集法も研究しています。日々、大規模データを収集、解析していると「この分野の研究活動に勢いがある」とか「このバイオリソースは別の分野にも使えるはずだ」といった知見が得られます。その知見を基に新たなバイオリソースを作成してバイオ研究界に提供し、研究の活性化に貢献したいのです。能動的にバイオリソースを整備していくことにも挑んでいくつもりです。
ぜひ、理研BRCのトップページに何かキーワードを入力してみてください。思わぬ発見があるかもしれません。
関連リンク
- バイオリソース研究センターホームページ(バイオリソース検索)
- バイオリソース研究センター 統合情報開発室