文部科学省

統合データベースプロジェクト
シンポジウム

6/12(Fri)
東大本郷キャンパス
武田ホールにて

Recent News

Jun 5, 2009
要旨集を公開しました

Jun 1, 2009
ポスタープログラムを掲載しました

April 27, 2009
シンポジウムサイトを開設しました

シンポ参加費無料

主催：
文部科学省／「統合データベースプロジェクト」シンポジウム実行委員会

大学共同利用機関法人　情報・システム研究機構　ライフサイエンス統合データベースセンター(DBCLS)

NBDC広報サイトへ

統合データベースプロジェクトシンポジウム 2009

「データベースが拓くこれからのライフサイエンス」

プログラム

開会挨拶
10:00～10:20	開会の挨拶	文部科学省
10:00～10:20	開会の挨拶	五條堀孝　(国立遺伝学研究所)
セッション1 データベースを統合する
		座長：高木利久 (ライフサイエンス統合データベースセンター)
10:20～10:40	わが国ライフサイエンスデータベースの現状と統合データベースセンターへの要望	平田正　(協和発酵キリン株式会社)
10:40～11:10	統合データベースプロジェクト：オープンで知のめぐりの良いライフサイエンス研究を目指して	坊農秀雅　(ライフサイエンス統合データベースセンター)
11:10～11:40	経済産業省ライフサイエンス統合DBプロジェクトのポータルサイトMEDALS	村上勝彦　(バイオ産業情報化コンソーシアム)
セッション2　データベース勢ぞろい
11:40～13:30	ポスター発表　(プログラムはこちら)
セッション3　データベースを作る
		座長：浅井潔 (産業技術総合研究所生命情報工学研究センター)
13:30～14:00	次世代シークエンサーを用いたゲノムインフォマティクス	森下真一　(東京大学)
14:00～14:30	蛋白質構造データバンク事業と国際的な展開	中村春木　(大阪大学)
セッション4　データベースを使う
		座長：徳永勝士 (東京大学)
14:30～15:00	トキシコゲノミクスプロジェクトで構築したデータベースとその応用	山田弘　(医薬基盤研究所）
15:00～15:30	データベースの有効利用による植物メタボロミクス研究の推進	斉藤和季　(理化学研究所、千葉大学)
15:30～15:55	休憩
セッション5　これからの統合データベース
15:55～17:15	パネル討論	司会：堀田凱樹 (情報・システム研究機構)
	大久保公策(国立遺伝学研究所)、金岡昌治(大日本住友製薬株式会社)、高木利久(ライフサイエンス統合データベースセンター)、中村春木(大阪大学)、菱山豊(文部科学省研究振興局ライフサイエンス課)
閉会挨拶
17:15～17:25	閉会の挨拶	堀田凱樹　(情報・システム研究機構)

＊プログラムは一部変更となる場合がございます。

プログラム詳細

開会挨拶
種別	挨拶
番号	1
タイトル	開会挨拶
名前	川上一郎
所属	文部科学省研究振興局ライフサイエンス課
発表資料	-
要旨	-

開会挨拶
種別	挨拶
番号	2
タイトル	開会挨拶
名前	五條堀孝
所属	国立遺伝学研究所
発表資料	-
要旨	-

閉会挨拶
種別	挨拶
番号	3
タイトル	閉会挨拶
名前	堀田凱樹
所属	情報・システム研究機構
発表資料	-
要旨	-

これからの統合データベース
種別	パネル討論
番号	1
タイトル	これからの統合データベース
名前	堀田凱樹1)，大久保公策2)，金岡昌治3)，高木利久4)，中村春木5)，菱山豊6)
所属	1)情報・システム研究機構，2)国立遺伝学研究所，3)大日本住友製薬株式会社，4)ライフサイエン統合データベースセンター，5)大阪大学，6)文部科学省研究振興局ライフサイエンス課
発表資料	パネル討論動画発表スライド(大久保) 発表スライド(金岡) 発表スライド(高木)
要旨	-

わが国ライフサイエンスデータベースの現状と統合データベースセンターへの要望
種別	口頭発表
番号	1
タイトル	わが国ライフサイエンスデータベースの現状と統合データベースセンターへの要望
名前	平田正
所属	協和発酵キリン株式会社
発表資料	発表動画発表スライド
要旨	日本ではこれまで、多額の公的資金がライフサイエンス分野に投入され、膨大なデータが生み出されてきた。その中には、日本人固有のデータをはじめとする、科学的評価の高い情報や産業分野での利用価値が高い貴重な情報も多い。しかしながら、それらの情報が公開されない、あるいは開示が不十分なケースが多いのも実情である。プロジェクロの終了後維持管理されず死蔵されているDBも少なくない。何より各機関で不統一のフォーマットでデータベース化されていてそれらの間を渡渉する検索も容易でない。ゲノム解読以来、ライフサイエンスはオミックスなど膨大なデータの産出とその情報処理に大きく依存する学問となっている。科学・産業分野における日本の国際競争力を高めていく上で、日本におけるバイオインフォマティクス環境の整備と優秀な人材の育成は欠かせない。そのためには、省庁の壁を超えた、データストレージ、大規模計算、そしてデータベース公開の機能を業務として担う恒久的なデータセンターと、それに付随し、情報解析から新たな付加価値を生み出すための高度なインフォマティクス研究を推進するナショナルセンターの設立が望まれる。NCBIやEBIといった海外のDBに多く依存している状況はライフサイエンス研究、産業化に重要な情報の安全保障上のリスクも大きい。このような認識を元にこれまで、バイオテクノロジー戦略会議の場で、また関係4省共管のバイオ産業情報化コンソーシアムのミッションと責任において、統合データベースのナショナルセンターの設立を提言してきた。ここでは実際の産業界でのデータベースの利活用の視点から(1) 公的資金による研究成果としての一次データベース開示のルール化, (2) 各省が協力連携できる組織、運営と継続性が担保できる予算措置, (3) サービス業務から研究活動、インフォマテイクス人材育成までの求められる機能, などについて提言したい。ライフサイエンスの主たるヘルスケア領域においては日本人、ひいては東南アジア民族固有のデータベースセンター構築まで視野に入れた国際貢献までめざしたい。 (シンポジウムセッション1 データベースを統合する)

統合データベースプロジェクト：オープンで知のめぐりの良いライフサイエンス研究を目指して
種別	口頭発表
番号	2
タイトル	統合データベースプロジェクト：オープンで知のめぐりの良いライフサイエンス研究を目指して
名前	坊農秀雅
所属	ライフサイエンス統合データベースセンター
発表資料	発表動画発表スライド
要旨	近年、DNAマイクロアレイや次世代DNAシーケンサーといった大量にデータを産生する実験装置の開発ならびにその普及によって、膨大な塩基配列情報や遺伝子発現プロファイル情報がデータベース（以下、DBと略す）として利用可能となっているものの、そういったデータを解釈して医学生物学的に新たな知見を得ることがそのデータの大量さ故に困難になってきている。そのような状況下で、文部科学省による「統合データベースプロジェクト」が平成18年度から5年間の年限プロジェクトとして立ち上げられた。本講演では、そういった研究を支えるインフラとして機能しつつある同プロジェクトとそれの中核機関であるライフサイエンス統合データベースセンター（DBCLS：Database Center for Life Science）に関して紹介する。DBCLSでは、統合DB構築は完結しないプロセスであると認識しDB構築のみならず維持することに注力し、唯一の統合DBを目指すのではなく研究開発の生産性を向上させることに主眼を置いている。独自に研究開発も行うもののサービス事業であることを認識し、可能な限り母国語である日本語で提供できるようインターフェースのみならず、日本語のコンテンツも充実させている。提供している各サービスは統合DBのポータルサイト「統合ホームページ」< http://lifesciencedb.jp/ >からアクセスすることができる。とくに、横断検索はライフサイエンス分野のDBが日本語でしかも一気に検索できるサービスで、検索語がLSD(Life Science Dictionary)などの辞書にあれば自動的に相当する英語の単語に変換されて検索され、英語のコンテンツしかないデータベースも日本語のキーワードで検索することが可能である。検索可能な日本語コンテンツの拡充にも努めており、なかでも生命科学分野の著名な日本語総説誌である「蛋白質核酸酵素」のバックナンバーの全文検索が発行後約２年が経過したものに対して約二十年分利用可能となっている。また、DBの使い方を動画のチュートリアルを作成し（統合TV）、統合ホームページから利用可能な日本発のDBのみならず、分子生物学者が普段よく使うPCR用のプライマー作成ソフトウェア(例えば、primer3)などのウェブツールについても広くカバーしている。その他の提供しているサービスについても時間の許す限り紹介する予定である。 (シンポジウムセッション1 データベースを統合する)

経済産業省ライフサイエンス統合DBプロジェクトのポータルサイトMEDALS
種別	口頭発表
番号	3
タイトル	経済産業省ライフサイエンス統合DBプロジェクトのポータルサイトMEDALS
名前	村上勝彦
所属	バイオ産業情報化コンソーシアム
発表資料	発表動画発表スライド
要旨	国家プロジェクト等によってライフサイエンス分野のデータベースが産生されてきたが、その統合によって情報を有効活用できる「統合データベース」が、産業界や学界から要望されている。バイオ産業情報化コンソーシアム（JBIC）と産業技術総合研究所・バイオメディシナル情報研究センター（BIRC, AIST）では、ヒト遺伝子統合データベース「H-Invitational Database（ http://www.h-invitational.jp/ , H-InvDB）」等のデータベース群を開発していたが、2008年4月に経済産業省の委託を受けて「経済産業省統合データベースプロジェクト」（2008-2011予定）を開始した。本プロジェクトの目的は、経済産業省関連の研究成果物等の整備・連携・統合による研究開発の促進である。我々は、まずデータベース等の情報を提供するポータルサイトMEDALS［メダルズ］（METI Database portal for Life Science）を構築した（ http://medals.jp/ ）。一方、ヒト遺伝子関連の分子データの統合を図って、H-InvDBと糖鎖関連遺伝子データベース、機能性RNAデータベース等との連携を進めている。MEDALSの内容としては、成果物便覧や関連プロジェクト情報、成果物アーカイブ、および本プロジェクトで開発した「MEDALSツール」がある。成果物便覧には、産業技術総合研究所、製品評価技術基盤機構（NITE）、新エネルギー・産業技術総合開発機構（NEDO）等による成果物の情報を載せている。2009年5月時点で、158件の成果物候補が判明しているが、そのうちデータベース40件、ツール32件の計72件についての便覧を提供しており、逐次件数を増やしている。成果物アーカイブには維持が困難になったデータベース等を置く。これらのデータ整備においては、文科省統合データベースプロジェクトでの統合を考慮し連携して進めている。「MEDALSツール」には、論文情報を定期的に自動収集する「新規文献お知らせツールPubMedScan」や、データベースへのリンクが簡単設定できる「リンク自動管理システム」、そしてデータベース間で対応したIDがわかる「ID一括変換システム」がある。これらはDB利用者・開発者の負荷を軽減し、持続可能な統合データベースの実現に寄与すると思われる。 (シンポジウムセッション1 データベースを統合する)

次世代シークエンサーを用いたゲノムインフォマティクス
種別	口頭発表
番号	4
タイトル	次世代シークエンサーを用いたゲノムインフォマティクス
名前	森下真一
所属	東京大学大学院新領域創成科学研究科情報生命科学専攻
発表資料	-
要旨	近年、ゲノム解読スピードは革命的に向上している。ゲノム解読装置1台が1日に解読できる量は 2002年の約200万塩基から2007年には 3縲鰀5 億塩基となり、5年間で 100 倍以上改善しコストは劇的に下がった。2009 年半ば現在、表１に示すように12縲鰀20億塩基である。1分子計測技術が発展し、今後3年間でさらに約 1,000 倍改善し 2兆塩基に達する可能性もある。約30億塩基対のヒトゲノムの解読には17年間要したが、2009年現在では約1ヶ月、3年後には10分程度になる可能性もある。次世代シークエンサーの性能を測るパラメータとして、１日もしくは実験当たりの塩基解読量がしばしば注目される。表１でこのパラメータを見るかぎり、３つの次世代シークエンサーの性能は 12縲鰀20億塩基／日であり、大きな差がないように見える。しかしながら、他のパラメータであるリード長、リード数、サンプル量、１回の実験にかかる時間の観点からは、各々のシークエンサーには他とは異なる特長があることが見てとれる。このようなパラメータに注目しながら、どのシークエンサーがどの応用例に向いているかを判断することが重要になる。本講演では、各パラメータの改善が、どのような応用例をあらたに開拓するかについての見通しを述べ、関連するソフトウエアの進展について解説する。 (シンポジウムセッション3 データベースを作る)

蛋白質構造データバンク事業と国際的な展開
種別	口頭発表
番号	5
タイトル	蛋白質構造データバンク事業と国際的な展開
名前	中村春木
所属	大阪大学蛋白質研究所
発表資料	発表動画発表スライド
要旨	近年急増している蛋白質、核酸等の生体高分子の立体構造データは、国際的な協力による分散・統合の仕組みを整えたwwPDB（worldwide Protein Data Bank）の組織によって、高い品質管理を保ちつつデータベース化され管理・運営がなされている。私たちは、大阪大学蛋白質研究所において、日本蛋白質構造データバンク（PDBj: PDB Japan）を組織し、（独）科学技術振興機構・バイオインフォマティクス推進センターの支援を受けて、米国のRCSB-PDB（Research Collaboratory of Structural Bioinformatics)、欧州のEBI(European Bioinformatics Institute)-PDBe、およびNMRデータを対象とする米国ウィスコンシン大学のBMRB（BioMagResBank）とともに、wwPDBの４つのメンバーの一員として、データ登録・編集・配布の作業に加えて、インターネットを通じた様々な検索サービスを提供している。wwPDBは、これらの研究を長年進めてきた構造生物学者のソサエティーが、解析された構造データを無料で公開し研究者の間でシェアすることが、競合する研究者がいたとしても科学の発展により有効に働くと判断したことによって設立された、公共のデータベースである。1971年から登録と配布が開始され、現在（2009年5月13日のアプデート時点）では、57,558個の立体構造が配布されている。全データの85 %がX線結晶解析によって決定され、14%がNMR法によるものであり、その他259個の電子顕微鏡による原子分解能の立体構造も登録されている。このような歴史があるため、wwPDBは、構造生物学ソサエティーの強い支援により、毎年行われるwwPDB国際諮問会議での議論と助言により、国際的に統一された形で、登録時における厳密な品質管理、標準的なデータの記述フォーマットとその検証、実験データの登録内容への追加等を進めてきた。現在では、登録時の省力化と国際統一化された検証作業のために、Common Deposition Toolの開発をwwPDBのメンバー内で実施している。これらの経験をふまえ、持続可能なデータベース運営のために必要な問題点を整理するとともに、日本の統合データベースへの期待を述べたい。　 (シンポジウムセッション3 データベースを作る)

トキシコゲノミクスプロジェクトで構築したデータベースとその応用
種別	口頭発表
番号	6
タイトル	トキシコゲノミクスプロジェクトで構築したデータベースとその応用
名前	山田弘
所属	独立行政法人医薬基盤研究所基盤的研究部トキシコゲノミクス・インフォマティクスプロジェクト
発表資料	発表動画
要旨	平成14縲鰀18年度に実施した「トキシコゲノミクスプロジェクト」（TGP）では、独立行政法人医薬基盤研究所（基盤研）、国立医薬品食品衛生研究所（国立衛研）及び製薬企業15社が参加し、毒性情報及び遺伝子発現情報などを集積した大規模データベースを構築した（ http://wwwtgp.nibio.go.jp/seika.html ）。データベースの構築においては、肝臓や腎臓への副作用報告がある医薬品、肝臓や腎臓での副作用発現のために開発を中断あるいは市場から撤退した医薬品に加え、肝毒性・腎毒性を有することが知られている毒性学的モデル化合物や毒性メカニズムが知られている化合物から約150化合物を選定し、in vivo系では製薬企業における毒性情報が最も豊富な動物種であるラット（肝臓及び腎臓が評価対象臓器）、in vitro系ではラット初代培養肝細胞及びヒト初代培養肝細胞を用い、選定した化学物質を曝露した際の遺伝子発現情報をAffymetrix社のGeneChip (R)マイクロアレイにより取得した。また、ラットを用いた実験では、単回投与及び28日間反復投与を実施し、遺伝子発現の用量相関的変化及び経時的変化を確実に捉えるため、単回・反復それぞれ4用量・4時点という十分な用量段階及びサンプリング時間を設定し、全ての用量・時点で、臓器重量、血液学、血液生化学、病理変化等の毒性学データを取得し、データベースに格納した。さらに、プロジェクト活動期間内には、データベースに解析及び毒性予測機能を加え、毒性評価支援システム（TG-GATEs：Toxicogenomics Project-Genomics Assisted Toxicity Evaluation system）の開発を行った。これらの研究成果を発展させるべく、基盤研、国立衛研及び製薬企業13社は、TGPの継続研究として「トキシコゲノミクス・インフォマティクスプロジェクト」（TGP2）を平成19年度より5年計画で開始した。本研究は、TG-GATEsを最大限に活用し、①安全性予測の向上・安全性バイオマーカーの開発、②ゲノミクスデータの応用によるヒトの副作用予測性の向上、③医薬品審査での安全性評価におけるゲノミクスデータの応用の３点を達成しようとするものであり、非臨床試験・臨床試験の効率化を目指している（図1）。本講演では、第1期プロジェクトでのデータベース構築、第2期プロジェクトの研究活動の中から安全性バイオマーカー探索に焦点をあて、その戦略及び研究経過を紹介する。(シンポジウムセッション4 データベースを使う)

データベースの有効利用による植物メタボロミクス研究の推進
種別	口頭発表
番号	7
タイトル	データベースの有効利用による植物メタボロミクス研究の推進
名前	斉藤和季
所属	理化学研究所　植物科学研究センター, 千葉大学　大学院薬学研究院
発表資料	-
要旨	植物メタボロミクスは、食料不足、健康増進、環境・エネルギーなど地球と人類を救う植物科学とバイオテクノロジーの根幹を支える先端科学と見なされている。シロイヌナズナやイネを始め、いくつかの高等植物の全ゲノム塩基配列が解読されたが、実験的にその機能が証明された遺伝子は少数に過ぎない。従って、これらの未知遺伝子機能を同定するゲノム機能科学が大きな課題になっている。そのためには、ゲノム、トラスクリプトーム、プロテオーム、メタボロームなどのいわゆるオーム科学を統合した研究を推進する必要がある。特に、精緻なメタボロミクスを駆使することによって、代謝に関係する遺伝子の機能決定をはじめ、代謝ネットワークの解明などが可能である。メタボロミクス研究は代謝物分析、バイオインフォマティクス、統合ゲノム生物学という三個の要素からなり、それらを有機的に統合することによって初めて実現できる。特に、データベースの有効利用がメタボロミクス研究推進の鍵であると考えられる。2005年に理化学研究所、植物科学研究センター(PSC)にメタボローム基盤研究グループが発足し、日本の植物メタボロミクス研究の中心の一つを担っている。この理研PSCメタボローム基盤研究グループでは、メタボローム研究を基盤とした統合ゲノム科学に基づく植物の量的ならびに質的な生産力向上を目指した研究プラットフォームの構築とその応用を進めている。また、本グループで開発したデータベースや解析ツールを下記のサイト(PRIMe)から公開し、世界のメタボロミクス研究コミュニティに貢献している。本講演では、データベースを利用して如何に効率的にメタボロミクス研究を推進するかについて述べ、今後どのようなデータベースを必要とするかについても議論したい。(研究グループウェブサイト Platform for RIKEN Metabolomics - PRIMe http://prime.psc.riken.jp/ )　。(シンポジウムセッション4 データベースを使う)

文部科学省

Recent News

「データベースが拓くこれからのライフサイエンス」

プログラム

プログラム詳細

リンク