生命機能科学研究センター(BDR)発生動態研究チーム
画像データのグローバルな共有が加速 ~データの公開で生まれる生命科学研究の好循環~
今、生命科学分野では、画像データのグローバルな共有システムの構築が進められています。そのリーダーシップをとっている大浪チームリーダーは、2013年にバイオイメージングのデータベース「SSBD」を開設し、今ではSSBDは世界を代表する画像データベースの1つになっています。最先端の顕微鏡画像データを無料で使うことができたり、自分が公開した画像データを見た人から共同研究の誘いがきたりと、新たな好循環が生まれています。
日欧米の連携で画像データを共有する動きが活発に
生命科学研究において、生体内の情報を可視化するイメージング技術は非常に重要であり、研究競争力を決定づけるといっても過言ではありません。しかし、最先端のイメージング装置は、高度な技術をもつ人が手作りで開発していたり、市販されているものは極めて高額であったりするため、限られた人しか使えないのが現状です。一方、近年は、オープンサイエンスの動きが世界中で活発化しており、研究データを公開・共有することが当たり前になりつつあります。
こうした状況を受け、生命科学の画像データについても共有を推進する取り組みが始まっています。私はその国際連携組織の議長の1人として、画像データのグローバルな共有システムの構築を進めています。現在は、私たちが運用する「SSBD」と、ヨーロッパの「BioImage Archive」、「IDR」というデータベースがあり、米国も最近、データベースの準備を始めています。今後、これらのデータベースを連携させ、日欧米を中心とした画像データ共有のプラットフォームをつくる予定です。
SSBDはもともとはSystems Science of Biological Dynamicsの略でしたが、SSBDの取り扱うデータが拡大したことに伴い、現在ではspell outせずに単にSSBDと表記するようにしています。
ここ数年、登録されるデータ数は飛躍的に増えている
SSBDは、2013年9月に科学技術振興機構 (JST)の資金で設立したデータベースです。当初は、私の本来の研究分野であるシステム生物学(生命システムをシステムとして理解する研究分野)で用いる生命動態の定量データやその元となる画像データを集め、公開していました。その後、イメージング技術の発展とともに画像データの重要性が増し、今では、画像データをメインに、生命動態の定量データや動画、シミュレーションのデータも蓄積されています。
特にここ数年は、データベースに登録されるデータの件数が飛躍的に伸びています(図1)。また、2020年に科学誌『Nature』で、生命科学の画像データ共有に関する特集記事が組まれ、SSBDが取り上げられるなど、世界的にも注目度が高まっています。
近年は、論文投稿時に研究データの公開を条件としている学術雑誌も増えており、SSBDはそうしたデータの公開の場としても利用することができます。SSBDでは、データを2層構造で管理しており、まず、論文で使用した画像データなどは最小限のメタデータをつけて「共用リポジトリ(SSBD:repository)」に保存され、すみやかに公開されます(図2)。そして、その中から、最先端イメージング技術の画像データなど、特に再利用性が高いと期待されるデータについては、豊富なメタデータをつけて「高付加価値データベース(SSBD:database)」にて公開されます。こうした2層構造にすることで、データの迅速な公開と再利用のしやすさの両方を実現しています。
データ共有のメリット:共同研究と解析技術開発の促進
オープンサイエンス化が進んでいるとはいえ、研究データを公開することに対して、抵抗を感じる人は少なくありません。私も研究者なのでその気持ちはよくわかります。ですが、データを公開することで、自分の研究の宣伝になり、共同研究の誘いがくるというメリットの方が圧倒的に大きいと、自分の経験や周囲の声から強く感じています。もちろん、公開されているデータを見て、「こういうデータが取れるなら、こんなことができるんじゃないか」とアイデアを得たら、自分から共同研究を申し込むこともできます。
また、ゲノム情報やタンパク質立体構造データの共有により、バイオインフォマティクスが大きく発展したように、画像データの共有は、画像データの解析技術の発展を加速することにもつながります。「自分のデータが役に立つだろうか」と思う人もいるかもしれませんが、例えば、AIの研究者がそのデータを使って、画像解析のアルゴリズムを開発することも考えられます。そうなれば、その解析技術は自分のデータによく適合するわけですから、将来的に自分にプラスに返ってくると期待できます。実際、SSBDは情報科学の研究者も多く利用しています。生命科学の研究者が思いつかないような自由な発想でデータを使って、解析技術の開発に役立ててほしいですね。
画像データの共有によって、このようなポジティブなサイクルを回すことを多くの人に考えていただけたら嬉しいです。
(取材・構成:秦千里/撮影:大島拓也/制作協力:サイテック・コミュニケーションズ)