bars cross

理研オープンサイエンスプラットフォーム

JA EN

2021年度OLSP研究課題

OLSPでは2021年度に以下の2件の研究課題(研究提案型2件)を所内公募により決定し開始しました。研究実施期間は2021年12月からの1年間の予定です。


refTSS4.0: 医科学研究応用に向けた転写開始点情報データベースとその利活用ツールの開発

[カテゴリー] 研究提案型

[研究実施者] 森岡勝樹

[所属] 生命医科学研究センター(IMS) 生命医科学大容量データ技術研究チーム

[研究概要] 本研究課題は、転写開始点リファレンス(refTSS)の次期バージョン(4.0)の開発に向けて、最新の転写開始点情報収集および、独自アノテーションの追加を行うことで、より徹底的で洗練された転写開始点リファレンスの作成を行うものです。本研究の特色として、GWASの形質情報と連鎖不平衡領域に基づいて、ヒト形質情報をゲノム座標に基づいて転写開始点に連携させ、転写産物の機能情報の手がかりとして利用できるデータの設計を行なっています。これにより、次期refTSSではゲノム規模解析結果から、ヒトの疾患や表現型への関連性をみることができるツールの開発を行います。また、short ORF情報に基づいたmicroproteinのアノテーションを作成し、これまでにない機能ゲノム情報に、転写開始点情報からアクセスできるデータベースを目指して開発を行います。

 

[研究報告] ヒト、マウスの転写開始点解析データを公共データベースから収集し、最新版の転写開始点リファレンスを作成しrefTSS ver4.1として公開した。さらに、そのデータ提供用 Web サイトを一新し、新しい ID 体系、シスエレメント候補情報、そして、新しい医科学研究用 web 解析ツールとして、GWAS-LD enrichment 解析の実装に成功した。現在論文投稿準備を進めている。


Moirai2パイプラインシステムの開発 – Hokusai-Sailing Shipを利用した計算リソースの拡充

[カテゴリー] 研究提案型

[研究実施者] 長谷川哲

[所属] 生命医科学研究センター(IMS) 生命医科学大容量データ技術研究チーム

[研究概要] 本研究課題は、データ処理パイプラインの作成・実行・管理を統括するシステム「MOIRAI(2014)」を改良し、理研内外の研究者(ユーザー)を増やし、研究を促進する事を目指します。この目標を達成する為に、MOIRAI2では四つの改良を行います。(1) Usability(使いやすさ)「BASHライクなコマンドライン」と「Webからのジョブの投入」の両方を可能にする。(2) Reproducibility(再現性) DockerやSingularity等の「コンテナ技術」を使い、どの環境でも結果を再現できるようにする。(3) Scalability(拡張性)データ科学基盤「Hokusai-Sailing Ship(Hokusai-SS)」を利用し、膨大な研究データの並列処理を可能にする。(4) Flexibility(柔軟性)パイプラインの各プロセスの繋がりをトリプル(主語・述語・目的語)で繋ぎ、多様な入力データに対応する。ユーザーはコマンドラインにオプションを追加するだけで、手軽にHokusai-SSにインスタンスを起動しコンテナ内でジョブを投げれる様になる。

 

[研究報告] 完成したMOIRAI2はGitHub(https://github.com/moirai2/moirai2)にて公開され、SCPortalen等のデータ処理・解析に使用されている。