bars cross

理研オープンサイエンスプラットフォーム

JA EN

環境資源科学研究センター(CSRS)メタボローム情報研究チーム

環境資源科学研究センター(CSRS)メタボローム情報研究チーム

メタボロミクスのリポジトリ「MetaboBank」
~代謝物のデータをアーカイブし、再利用する流れをつくる~

代謝物を網羅的に解析するメタボロミクスのリポジトリ「MetaboBank」が2021年に開設されました。標本のようにメタボロミクスのデータを広く集め、恒久的に保管し、第三者が参照したり再解析したりすることを目的としています。MetaboBankの設計・構築を行った有田 正規チームリーダーに、データを残すことの意義や展望について語っていただきました。

有田チームリーダーの写真

有田 正規(アリタ・マサノリ)
環境資源科学研究センター
メタボローム情報研究チーム チームリーダー

質量分析技術の進歩とともにメタボロミクス研究が加速

生体内では、生命活動によってさまざまな代謝物が産生されています。この代謝物の総体を「メタボローム」といい、メタボロームを網羅的に解析するための手法や研究分野のことを「メタボロミクス」といいます。

 

メタボロミクスは、ゲノミクス、プロテオミクスに続く第三のオミクスです。メタボロミクスの研究は、2000年頃から盛んに行われるようになりました。その背景には質量分析技術の進歩があります。生体内の代謝物は、糖やアミノ酸、有機酸、脂質、ビタミン類など実に多様です。メタボロミクスでは、分子量がおよそ1500以下の低分子化合物を網羅的に検出して、一斉に質量を測定します。ゲノムやプロテオームと比べて、メタボロームの解析は技術的に難しいのですが、質量分析技術の発達によってそれが可能になったのです。

 

ただし、最先端の質量分析装置は非常に高価で、専門的な技術も必要になります。また、希少な生物を調べたい場合など、サンプルが手に入らないこともあります。そうした背景から、メタボロミクスのデータを一元的に保管し、誰でもデータを利活用できるようにするための公共リポジトリが欧州と米国でつくられました。日本は少し遅れをとりましたが、私たちは2021年にアジアで初めてメタボロミクスの公共リポジトリとして「MetaboBank」を開設しました。

 

データの恒久的な保存と再利用を実現するために

MetaboBankはメタボロミクスのデータを恒久的に保存し、第三者がデータを再利用できるようにすることを目的としています。そのため、MetaboBankは、塩基配列のリポジトリとして40年近くの歴史があり、世界的にも認知されているDDBJ(日本DNAデータバンク)の管轄内で運用しています。私は理研のほか、国立遺伝学研究所(遺伝研)のDDBJセンター長も務めており、MetaboBankの設計や構築を行ってきました。データの管理など実際の運用はキュレーターが行っています。

 

また、MetaboBankに登録されたデータの再利用を可能にするためには、そのデータがどういうものかを説明するメタデータの記載が不可欠です。メタボロミクスでは、測定する化合物の種類が多様である上、発酵食品のように植物と菌が混ざったサンプルなども扱います。そのため、サンプルの抽出方法や測定方法も多様であり、どうやってサンプルを用意したか、どのような方法で測定したかといったメタデータを記載する必要があるのです。

図1 SSBDに登録されているデータ数の推移グラフ

図1MAGE-TAB におけるIDF,SDRF, 生・解析済みデータファイル・MAF の関係
MetaboBankのメタデータは、ゲノミクス、プロテオミクスでも使われている MAGE-TAB 形式だ。

 

しかし、メタデータの記載項目を増やせば手間が増えて登録されにくくなりますし、かといって記載項目を減らせばデータが再利用できなくなってしまいます。そのバランスが難しく、苦労したところです。統一した記載法を定めて、ようやくMetaboBankの運用をスタートすることができました。MetaboBankのHPに登録手順を詳しく記載しているので、ご確認の上、ぜひデータを登録していただきたいと思います。

(Metabobankへの登録:https://www.ddbj.nig.ac.jp/metabobank/submission.html

 

開設して間もないため、登録数はまだ少ないですが、周知活動とともに少しずつデータは増えています。研究機関だけでなく、食品分野をはじめとする企業などにも登録を呼びかけています。理研は、国内屈指のメタボロミクス研究基盤を備えており、環境資源科学研究センターで得られたデータはMetaboBankに登録しています。ぜひダウンロードしてデータを利用してください。

 

標本のように何十年後も参照できるように

メタボロミクスは、基礎研究だけでなく、医療、農業、食品、環境などさまざまな分野への応用が加速しています。こうした中、データを残し、再利用することの需要はますます高まっています。例えば、50年後に今の環境の状態や食品の品質がどうだったかを知るためには、メタボロミクスのデータをきちんと残しておくことが重要です。未来の技術で今のデータを解釈したら、別のことが発見される可能性もあります。また、絶滅危惧種の生物は、今データを残しておかなければ、絶滅してしまったらどんな代謝物を持っていたかを知ることができなくなってしまいます。

 

そもそも科学は、標本などをつくって自然の記録を保存してきたことで、後世に渡り伝承されてきました。研究のデータは知の財産であり、データを残すことは、将来の科学のためにとても重要です。今は研究競争の中で論文を出すことが重視されていますが、論文だけでは再現性のあるデータは残らないことがほとんどです。自分の研究で得たデータが失われてしまう可能性があるのです。50年後に何が残るか、何のために科学をしているかを改めて考え、将来を見据えて研究してほしいと強く思っています。

 

また、リポジトリの維持管理コストも大きな課題です。今はMetaboBankもDDBJも遺伝研が運営していますが、年々増えていくデータを維持し続けるには限界があります。国の財産でもあるこれらのリポジトリをどう維持していくかという議論も必要だと考えています。

 

(取材・構成:秦千里/撮影:相澤正。/制作協力:サイテック・コミュニケーションズ)

関連リンク

 

関連書籍

  • 『学術出版の来た道』 有田正規 著,岩波書店,2021年