ポスター発表は
10月4日 14:45 ~ 16:05(奇数番号のポスター説明14:55~15:55)
10月5日 14:30 ~ 15:50(偶数番号のポスター説明14:40~15:40)
を予定しております。
発表者はこちら(ポスター様式、ポスター設置・撤去などのタイムスケジュール等)を ご覧ください。
※ポスター発表の内容の関係性を表わした図はこちらからご覧いただけます(9月27日更新)。


※ポスターや発表スライド等の著作権は、別途記載がない限り発表者・発表者の所属機関に帰属します。
 ポスター・スライド内の図や文言を転用する際には、著作者と話し合っていただくようお願いいたします。
番号  代表発表者所 属タイトル発表資料
1  坂東明日佳 科学技術振興機構 バイオサイエンスデータベースセンター※ Integbioデータベースカタログ:生命科学系データベースの所在情報を収集して発信する取り組み pdf-i
2  村上勝彦 産業技術総合研究所 創薬分子プロファイリング研究センター 経済産業省ライフサイエンスデータベース Project Portal:MEDALS pdf-i
3  大波純一 科学技術振興機構 バイオサイエンスデータベースセンター 生命科学系データベース横断検索サービスの現状と今後 pdf-i
4  伊藤真和吏 医薬基盤研究所 創薬基盤研究部 バイオインフォマティクスプロジェクト 創薬・疾患研究のための生命科学分野のデータベース横断検索システム Sagace pdf-i
5  畠中秀樹 科学技術振興機構 バイオサイエンスデータベースセンター 多様なデータ発信の場としての生命科学系データベースアーカイブ pdf-i
6  坂手龍一 医薬基盤研究所 難病・疾患資源研究部 難病資源研究室 創薬・疾患研究をサポートする医薬基盤研究所のデータベース pdf-i
7  倉田真由美 医薬基盤研究所 難病・疾患資源部 政策・倫理研究室 個人情報≠遺伝情報の取扱について―各指針の比較検討から pdf-i
8  川嶋実苗 科学技術振興機構 バイオサイエンスデータベースセンター ヒトデータ共有ガイドラインとヒトデータ提供・利用申請の紹介 pdf-i
9  小池麻子 日立製作所中央研究所  統合化推進プログラムにおけるヒトゲノムバリエーションデータベース
10  三橋信孝 科学技術振興機構 バイオサイエンスデータベースセンター ヒト脳疾患画像統合データベース構築におけるJ-ADNI の取り組み pdf-i
11  岡田直大 東京大学大学院医学系研究科 精神医学分野 精神疾患の病態解明に向けた神経画像・死後脳研究の技術的支援 pdf-i
12  川口喬久 京都大学医学研究科 附属ゲノム医学センター 疾患ゲノム疫学解析分野 大規模ゲノム疫学研究の統合情報基盤の構築 pdf-i
13  市原寿子 かずさDNA研究所  ゲノム情報に基づく植物DBの統合 pdf-i
14  中谷明弘 新潟大学 遺伝子オルソログDBの構築とそれに基づく植物ゲノムDBの統合 pdf-i
15  大林武 東北大学大学院情報科学研究科 ATTED-II: 植物の遺伝子共発現データベース pdf-i
16  黒川顕 東京工業大学大学院生命理工学研究科 微生物統合データベース MicrobeDB.jp pdf-i
17  川島秀一 情報・システム研究機構 ライフサイエンス統合データベースセンター 微生物データ統合を目指したオントロジーの開発 pdf-i
18  山本希 東京工業大学大学院生命理工学研究科 微生物の生息環境データの記述および高度な検索のためのオントロジー構築 pdf-i
19  内山郁夫 自然科学研究機構 基礎生物学研究所 微生物ゲノムデータベース MBGDのデータ構築戦略 pdf-i
20  千葉啓和 自然科学研究機構 基礎生物学研究所 セマンティックWeb技術を用いたオーソログデータベース統合化の試み pdf-i
21  藤澤貴智 情報・システム研究機構 国立遺伝学研究所 生命情報研究センター Genome Refine: 微生物ゲノム基盤情報ならびにアノテーションリファレンスのRDFを活用したゲノムアノテーションサービス開発 pdf-i
22  田辺麻央 京都大学化学研究所 ゲノム・メタゲノム解釈ツールKEGG Mapper pdf-i
23  米納朋子 京都大学化学研究所 KEGG MEDICUSとお薬手帳 pdf-i
24  陳怡安 医薬基盤研究所 創薬基盤研究部 バイオインフォマティクスプロジェクト TargetMine, a data warehouse system for target discovery pdf-i
25  五十嵐芳暢 医薬基盤研究所 創薬基盤研究部 トキシコゲノミクス・インフォマティクスプロジェクト Toxygates,トキシコゲノミクスデータとlinked data の統合解析プラットフォーム
26  高橋和博 製品評価技術基盤機構 化学物質管理センター 情報業務課 NITEの化学物質管理に関する公開データベース pdf-i
27  藤田典昭 産業技術総合研究所 糖鎖医工学研究センター 分子構造による糖鎖関連物質の検索システム pdf-i
28  ソロビヨワ・
   イェレナ
産業技術総合研究所 糖鎖医工学研究センター 遺伝的要因の関与する糖鎖関連疾患に関するオントロジーの開発 pdf-i
29  鈴木芳典 産業技術総合研究所 糖鎖医工学研究センター GlycoScience Protocol Online Database pdf-i
30  鹿内俊秀 産業技術総合研究所 糖鎖医工学研究センター 日本糖鎖科学コンソーシアム・データベース(JCGGDB)の機能拡充
31  山田一作 野口研究所 糖鎖有機化学研究室 GlycoNMR Database pdf-i
32  加藤雅樹 理化学研究所 マックスプランク連携研究センター システム糖鎖生物学グループ 糖鎖構造生物学研究チーム RIKEN Glycan Confromation DataBase (RGCDB) pdf-i
33  蒔田由布子 理化学研究所 情報基盤センター 統合データベース特別ユニット PosMed: フェノタイプ情報と文献の統合によるバイオリソースの推論検索 pdf-i
34  荒武 かずさDNA研究所 Metabolonote: メタボロミクスのデータリソースを統合するメタデータ専用管理システム pdf-i
35  ホー・ケネス 理化学研究所 生命システム研究センター 発生動態研究チーム BDML: 生命動態システム科学の定量データを記述する言語 pdf-i
36  遠里由佳子 理化学研究所 生命システム研究センター 発生動態研究チーム 生命動態システム科学の統合データベースの開発 pdf-i
37  京田耕司 理化学研究所 生命システム研究センター 発生動態研究チーム WDDD: 線虫C. elegans初期胚の定量細胞分裂ダイナミクスデータベース
38  中村春木 大阪大学蛋白質研究所 PDBjとwwPDBにおける蛋白質構造データ統合化 pdf-i
39  小林直宏 大阪大学蛋白質研究所 生体高分子NMRデータベース、 BMRBにおけるデータベース統合化の新展開
40  世良実穂 産業技術総合研究所 創薬分子プロファイリング研究センター ヒト転写産物統合データベースH-InvDBのプロテオミクスへの利用 pdf-i
41  中村保一 情報・システム研究機構 国立遺伝学研究所 生命情報研究センター DDBJ
42  大田達郎 情報・システム研究機構 ライフサイエンス統合データベースセンター DBCLS SRA: 公共NGSデータの再利用促進技術開発 pdf-i
43  小野浩雅 情報・システム研究機構 ライフサイエンス統合データベースセンター 遺伝子発現リファレンスデータセット RefEx pdf-i
44  内藤雄樹 情報・システム研究機構 ライフサイエンス統合データベースセンター 統合遺伝子検索GGRNA ver.2 pdf-i
45  坊農秀雅 情報・システム研究機構 ライフサイエンス統合データベースセンター カイコ機能アノテーションパイプラインの構築とその応用 pdf-i
46  田中剛 農業生物資源研究所 農業生物先端ゲノム研究センター ゲノムインフォマティックスユニット 農畜産物ゲノム研究推進のための情報解析パイプライン構築
47  福井一彦 産業技術総合研究所 生命情報工学研究センター 解析ワークフローとデータベースの連携基盤構築 pdf-i
48  時松敏明 京都大学化学研究所 バイオインフォマティクスセンター ゲノムネットにおけるデータ統合と新規分野データ開発のための基盤技術開発 pdf-i
49  片山俊明 情報・システム研究機構 ライフサイエンス統合データベースセンターー TogoGenome/TogoStanza: データ統合と再利用性向上のためのゲノム情報デザイン pdf-i
50  河野信 情報・システム研究機構 ライフサイエンス統合データベースセンター TogoTable update 2013 pdf-i
51  呉紅艶 情報・システム研究機構 ライフサイエンス統合データベースセンター 生命科学データに適したトリプルストア調査 pdf-i
52  山口敦子 情報・システム研究機構 ライフサイエンス統合データベースセンター セマンティックウェブ技術を用いた生命科学系データベースアーカイブのデータ統合 pdf-i
53  櫛田達矢 科学技術振興機構 バイオサイエンスデータベースセンター バイオサイエンスデータベース統合に向けて ~NBDC実務者連絡会の活動のこれまでと今後~ pdf-i
54  山本泰智 情報・システム研究機構 ライフサイエンス統合データベースセンター テキスト処理技術を用いたキュレーション支援 pdf-i
55  藤原豊史 株式会社インテック 論文の引用情報検索システムColil pdf-i
56  飯田 啓介 情報・システム研究機構 ライフサイエンス統合データベースセンター 新しい日本語Webコンテンツ、「新着論文レビュー」と「領域融合レビュー」 pdf-i






番 号 1
タイトル Integbioデータベースカタログ:生命科学系データベースの所在情報を収集して発信する取り組み
発表者 坂東明日佳1)、井上圭介2)、熊谷禎洋3)、川本祥子4)、畠中秀樹1)
所 属 1)科学技術振興機構 バイオサイエンスデータベースセンター 2)日立公共システムエンジニアリング株式会社  3)株式会社日立ソリューションズ 4)情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨 バイオサイエンスデータベースセンター (NBDC)ではデータベース統合の第一段階として生命科学系データベースの所在を調べ、URLや生物種などの基本的な属性 (メタデータ)をまとめた「Integbioデータベースカタログ」(http://integbio.jp/dbcatalog/)を公開している。2013年7月時点で国内約900DB、国外も含め約1,300DBを記載している。
網羅性を最大の課題とする本事業では、文部科学省・厚生労働省・農林水産省・経済産業省が独自にもつデータベースリストを集約しその後も各省で情報収集を進めている。NBDCでは文部科学省の研究資金により産生されたデータベースを洗い出すためさきがけや科研費などの制度別に成果報告書を利用した所在調査を実施している。
6月には本カタログの英語版も公開し海外に向けた情報発信を本格的に開始した。またカタログのRDF化についてBioHackathonを通じ海外のカタログ関係者と議論を進めている。今年度はさらにユーザーの利便性向上のため生物の分類によるデータベースの絞り込み機能やmicrodataによるマークアップの追加等も進める予定である。
番 号 2
タイトル 経済産業省ライフサイエンスデータベース Project Portal:MEDALS
発表者 村上勝彦1)、間宮健太郎1)、今西規1)2)
所 属 1)産業技術総合研究所 創薬分子プロファイリング研究センター  2)東海大学医学部 基礎医科学分子生命科学
要 旨 経済産業省ライフサイエンスデータベースプロジェクトは、経済産業省関連の研究成果物等の整備・統合をすすめるプロジェクトである。経済産業省関係で開発されたバイオ・データベース(DB)の情報を収集し、ポータルサイトMEDALS(METI Database portal for Life Science)で公開している。継続的に便覧の追加・更新を行った結果、DB・解析ソフトの登録数は156個に達し、経済産業省関連の成果物を網羅的に情報提供している。MEDALSの主な内容は、DBと解析ソフトおよびプロジェクトの「便覧」、「アーカイブ」、「MEDALS横断検索」、および「MEDALSツール」である。新機能としては、便覧に登録しているDBの属性(例えば、生物種と分子種)を軸にして分類表示できる「DB分類」がある。「MEDALSツール」の新機能としては、利用者が興味をもっている論文に関係する新規論文を推薦する文献推薦システム「PubMedScan」について、任意のアラート間隔設定や過去1ヶ月程度の関連文献を検索できるようにした改良版を公開した。
番 号 3
タイトル 生命科学系データベース横断検索サービスの現状と今後
発表者 大波純一1)、杉崎太一朗2)、青木健一2)、平井信一 2)、牧口大旭2)、奥村利幸2)、川本祥子3)
畠中秀樹1)、三橋信孝1)
所 属 1)科学技術振興機構 バイオサイエンスデータベースセンター  2)三井情報株式会社  3)情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨 生命科学系データベースの統合的な利用を目指すNBDCでは、データベース一括検索ツールとして「生命科学データベース横断検索」を公開している。これは主に国内でWeb公開されている生命科学系データベースや日本語の総説・研究報告書・特許公報・学会要旨等を対象としており、DB数は2013年7月時点で369件に上る。NBDCが公開しているIntegbioデータベースカタログや生命科学系データベースアーカイブ、JST、DBCLS、連携省庁の機関が公開する各種データベースサービスとも連携し、利用者は広大な生命科学系データの海から、あらゆるキーワードを介して情報を掬い上げることができる。現在、検索インターフェースの改善、タブレット端末対応、マニュアル整備、検索スピード高速化等、利用拡大に向けた施策を検討している。また検索エンジンとしての適切なデータ更新方法についても改善を続けている。生命科学系研究を駆動する 公開データベースの数は加速的に増加しており、横断検索環境への需要は今後も増加していくと考えられる。
番 号 4
タイトル 創薬・疾患研究のための生命科学分野のデータベース横断検索システム Sagace
発表者 伊藤真和吏1)、森田瑞樹1)2)、五十嵐芳暢3)、陳怡安1)、長尾知生子1)、坂手龍一4)、増井徹5)
水口賢司1)
所 属 1)医薬基盤研究所 創薬基盤研究部 バイオインフォマティクスプロジェクト 2)産業技術総合研究所 ヒューマンライフテクノロジー研究部門 3)医薬基盤研究所 創薬基盤研究部 トキシコゲノミクス・インフォマティクスプロジェクト 4)医薬基盤研究所 難病・疾患資源研究部 難病資源研究室 5)医薬基盤研究所 難病・疾患資源研究部 政策・倫理研究室
要 旨 医薬基盤研究所では、JSTバイオサイエンスデータベースセンターと連携し、データベース横断検索システム “Sagace http://sagace.nibio.go.jp/”を開発・公開している。
Sagaceは、創薬・疾患に特化した約300のデータベースを選定・分類して検索対象とし、ファセット(データベースの分類)による検索結果の効率的な絞り込みとメタデータ(データに関する事項を記述したデータ)の活用を特徴としている。メタデータの付与には、microdata(HTMLにメタデータを埋め込むための形式)を利用している。メタデータが埋め込まれると、文字情報の少ないライフサイエンスのデータにより多くの意味を、統一的な語彙体系で与えることが出来、検索結果にそれらのデータを明確に反映できる。その結果、ユーザーが求めている検索結果を、より迅速に発見できるようになることが期待される。
最近では、microdataによるライフサイエンスの語彙と記述方法の策定、検索結果に反映される項目の拡張(生物種、疾患名、最終更新日、エントリーID、関連するDBエントリー)、メタデータに対応したデータベースの増強を行った。これらの取り組みを通して、より効率的な検索システムの構築を目指している。
番 号 5
タイトル 多様なデータ発信の場としての生命科学系データベースアーカイブ
発表者 畠中秀樹1)、大久保克彦2)、井上圭介3)、熊谷禎洋2)、坂東明日佳1)
所 属 1)科学技術振興機構 バイオサイエンスデータベースセンター  2)株式会社日立ソリューションズ 3)日立公共システムエンジニアリング株式会社
要 旨 生命科学系データベースアーカイブは、国内で産生されたデータをダウンロード可能な形で長期間維持するサービスである。一方でアーカイブは、ダウンロード以外の形でも多様なデータ発信を行い、寄託データの付加価値を高める努力を続けている。
アーカイブの簡易検索ページでは、表データをTogoDBに収納した後、画像やリンクを配置したりJavaScriptを組み込んだりして、元のデータベースの利便性の再現に努めている。実際、終了したBIRDなどの複数のサービスが、アーカイブにより再現されている。
さらに検索については、データセット横断的なキーワード検索・配列相同性検索・画像検索が整うとともに、TogoDBのRDFダウンロード機能の追加を受け、既にトリプルストアにアーカイブRDFを収納しており、SPARQL検索の提供を検討している。
また、NBDCのカタログや横断検索、四省連携ポータルintegbio.jpからの各種連携に加え、microdataによるSagaceやGoogleからの検索の高度化も進めており、来年度から本格化する統合検索への取り組みの中で、寄託データが重要な役割を果たせるよう努めていきたい。
番 号 6
タイトル 創薬・疾患研究をサポートする医薬基盤研究所のデータベース
発表者 坂手龍一1)、深川明子2)、平田誠1)、山下智也3)、山田弘4)、高橋一朗1)、増井徹2)
所 属 1)医薬基盤研究所 難病・疾患資源研究部 難病資源研究室 2)医薬基盤研究所 難病・疾患資源研究部 政策・倫理研究室 3)日立製作所 4)医薬基盤研究所 創薬基盤研究部 トキシコゲノミクス・インフォマティクスプロジェクト
要 旨 厚生労働省の研究機関である独立行政法人医薬基盤研究所(基盤研)では、創薬・疾患研究をサポートするデータベースを公開している。(1) 難病研究を推進する公的バンク「難病研究資源バンク」(http://raredis.nibio.go.jp)では、45疾患700試料(DNAや血清など)が分譲可能である。 (2)化合物暴露による遺伝子発現・毒性情報を提供する「トキシコゲノミクスデータベース(Open TG-GATEs)」(http://toxico.nibio.go.jp)では、新たに高解像度病理画像(Virtual Slide)との連携機能を実装した。(3) 厚生労働省の研究機関の生物資源情報を提供する「メディカルバイオリソースデータベース」(http://mbrdb.nibio.go.jp)では、300件以上の情報を公開している。これらを含む10データベース20万件のデータは、横断検索システム(http://alldbs.nibio.go.jp)で一括検索できる。基盤研へ移管されたヒューマンサイエンス研究資源バンクの情報(http://bioresource.nibio.go.jp)も検索対象に追加予定である。また、国内のデータベース横断検索システム”Sagace”(http://sagace.nibio.go.jp)と連携することで、多様なバイオリソースの活用促進に貢献すると信ずる。
番 号 7
タイトル 個人情報≠遺伝情報の取扱について―各指針の比較検討から
発表者 倉田真由美1)、深川明子1)、坂手龍一2)、堤正好3)、増井徹1)
所 属 1)医薬基盤研究所 難病・疾患資源部 政策・倫理研究室 2)医薬基盤研究所 難病・資源研究室
3)株式会社エスアールエル学術企画部
要 旨 今年2月「ヒトゲノム・遺伝子解析に関する倫理指針」が全面改正された。指針の見直しに向けた検討の中で、個人情報保護規制との整合性が重視された。一方で、遺伝情報をどのように取扱うべきかという倫理的検討課題は後景に押しやられ、個人情報保護開示を希望する場合は原則開示することが明記された。
本発表では、遺伝情報と個人情報をどう取扱うべきかについて検討するために、研究活動、企業活動、医療の分野の指針を比較した。研究領域では「ヒトゲノム・遺伝子解析に関する倫理指針」、「臨床研究に関する倫理指針」、「疫学研究に関する倫理指針」、また、企業活動では「事業分野における個人情報保護ガイドライン(経済産業省個人遺伝情報保護ガイドライン)」、「個人情報の保護に関する法律についての経済産業分野を対象とするガイドライン」、及び医療に関わる「医療における遺伝学的検査・診断に関するガイドライン」を整理比較し、それぞれの指針の個人情報と遺伝情報の取扱いの相違点とそれらの適切な取り扱いについて考察した。
番 号 8
タイトル ヒトデータ共有ガイドラインとヒトデータ提供・利用申請の紹介
発表者 川嶋実苗、三橋信孝、箕輪真理
所 属 科学技術振興機構 バイオサイエンスデータベースセンター
要 旨 ヒトに関するデータは、次世代シークエンサーや画像データをはじめ、解析技術の発達に伴って膨大な量が産生されつつある。それらを整理・格納して、生命科学の進展のために有効に活用するためのルールや仕組みが必要である。
独立行政法人科学技術振興機構(JST)バイオサイエンスデータベースセンター(NBDC)では、個人情報の保護に配慮しつつ、ヒトに関するデータの共有や利用を推進するためにヒトデータに関する様々なデータベース等を共有するためのプラットフォーム『NBDCヒトデータベース』を設立するとともに、国立遺伝学研究所 DNA Data Bank of Japan (DDBJ)と協力してヒトに関するデータの公開を進めている。また、その運用ルールとしての『NBDCヒトデータ共有ガイドライン』および『NBDCヒトデータ取扱いセキュリティガイドライン』を策定し公開した(http://humandbs.biosciencedbc.jp/guidelines)。共有ガイドラインを遵守してデータ共有を行なう上でのポイント、および、データ提供申請や利用申請における必要書類と具体的な申請方法について紹介する。
番 号 9
タイトル 統合化推進プログラムにおけるヒトゲノムバリエーションデータベース
発表者 小池麻子1)、澤井裕美2)、川嶋実苗2)、井ノ上逸朗3)、辻省次4)、徳永勝士2)
所 属 1)日立製作所中央研究所 2)東京大学大学院医学系研究科 3)情報・システム研究機構 国立遺伝学研究所  4)東京大学医学部附属病院
要 旨 近年の高速大容量のSNPタイピング技術と超並列シークエンシング技術の急速な発展により、ゲノムワイドな疾患関連多型・変異探索が可能となり、多くの疾患関連遺伝子が発見されつつある。我々のグループでは国内/アジアにおけるこれらのデータの散逸を防ぎ研究者間でデータ共有化するために、2007年よりGWAS-DB、CNV-DBを、2011年度よりHuman variation DB、HLA-DBを構築し(https://gwas.biosciencedbc.jp) GWASデータ、NGS変異データのサブミッションを広く呼びかけるとともにデータの預け入れと再配布の運用を行っている。これらのDBにおいては新規のGWASのデータ、健常者や患者の多様な変異(SNV、長配列の挿入/欠失、構造多型)を収集対象とし、日本人/アジア人の変異と表現型(疾患、薬剤応答、ウィルス耐性)との関係の体系化を目指している。また、文献中に埋もれている疾患情報も収集対象とし、20,000以上のエントリーを登録している。
番 号 10
タイトル ヒト脳疾患画像統合データベース構築におけるJ-ADNI の取り組み
発表者 三橋信孝1)、千田哲子2)、石田剛3)、鶴瀬和彦3)、槇野正2)、上野正孝2)、岩坪威4)
所 属 1)科学技術振興機構 バイオサイエンスデータベースセンター 2)バイオテクノロジー開発技術研究組合
3)日鉄日立システムエンジニアリング  4)東京大学大学院医学系研究科
要 旨 我々は「精神疾患の病態解明に向けたMRI脳画像データベース(包括型脳科学研究推進支援ネットワークDB)」と連携し、両者のデータを統合したヒト脳疾患画像統合データベースの構築を進めている。本発表ではDB構築に向けたJ-ADNI(Japanese Alzheimer’s Disease Neuroimaging Initiative)の活動を紹介する。
全国38か所のJ-ADNI臨床施設から提供される、健常高齢者(154人)、軽度認知障害(239人)、軽症アルツハイマー病(152人)の脳画像(MRI, PET)、臨床情報、心理検査、ApoE遺伝子型、体液生化学情報を2~3年間収集した。品質管理ならびに機器ごとに異なる画像の歪みやむらの補正を行いながら、一元管理のためのローカルデータベースの構築を行っている。ベースライン時点の検体は収集を完了し、ベースライン以降についても90%以上完了した。現在、米国ADNIとの互換性を考慮しながら、公開データの内容について検討中である。公開方法については、個人の特定につながらないデータ項目定義や補正・品質管理方法などのメタデータは、オープンデータとしてヒト疾患脳画像データベース(http://bidb.biosciencedbc.jp/)にて公開し、個人単位のデータ(脳画像、テキスト)は、NBDCヒトデータベースへ寄託して制限公開する予定である。
番 号 11
タイトル 精神疾患の病態解明に向けた神経画像・死後脳研究の技術的支援
発表者 笠井清登、岡田直大、八幡憲明、西村幸香
所 属 東京大学大学院医学系研究科 精神医学分野
要 旨 精神疾患の病態研究では、分子・細胞・動物モデル・神経画像などのモダリティで様々な知見が蓄積されてきた。今後、その病因・病態に関わる要因の同定や、仮説検証の試みを一層加速させるためには、MRI脳画像のような研究リソースを従来以上に充実させ、これを包括的に利用しながら研究を進めることが重要と思われる。ただし、個別のグループが一定の研究目的に従い、短期間でリソースを多数取得することは容易でない。また、病態解明に真のブレークスルーをもたらすためには、データ解析や統計理論に熟知した専門家、最新の分子生物学的解析法に精通する基礎神経科学者との連携も不可欠である。
我々は、包括型脳科学研究推進支援ネットワークの疾患拠点として、精神疾患のMRI脳画像と付随する臨床情報を多数例収載したデータベースの構築を進めてきた(健常群130例、疾患群50例)。また、MRI画像の収集・管理・解析についてもプロトコルの標準化を図り、研究者コミュニティに対して普及活動と運用支援を行ってきた。このような活動により研究基盤が整備されつつあり、将来的に、精神疾患に関連する新規バイオマーカーの発見や新規治療法の開発の促進につながることが期待される。
番 号 12
タイトル 大規模ゲノム疫学研究の統合情報基盤の構築
発表者 川口喬久1)、佐藤孝明2)、山田亮3)、松田文彦1)
所 属 1)京都大学医学研究科 附属ゲノム医学センター 疾患ゲノム疫学解析分野 2)株式会社島津製作所 基盤技術研究所 ライフサイエンス研究所  3)京都大学医学研究科 附属ゲノム医学センター 統計遺伝学分野
要 旨 ゲノムコホート研究は、疾患を含む種々の形質と、遺伝因子や環境因子などの多様な因子との関連や因果関係やそれらの相互作用を明らかにすることで、過去に得られた医学的知見の検証や新たな発見を目的とする。そのためには、研究参加者のゲノム情報や長期の観察による様々な表現型や中間形質に加えて環境・生活習慣情報を、解析に適したデータの標準化を施したのち適正な方法で解析しなければならない。また、長期追跡のためには連結可能匿名化が必須であるが、集積される情報には個人のゲノム情報が含まれるため、参加者のプライバシー保護を最優先した個人情報管理の枠組みの構築が極めて重要である。本研究の目標は、大規模ゲノムコホート研究の情報基盤のデータベースを構築し、類似した研究でその利活用を促すとともに、モデル研究として「ながはま0次予防コホート事業」のベースライン情報を集積し、広く公開することである。現在までに、以下に挙げる研究開発項目を実施した。
ながはま0次コホート事業および、臨床研究を含む複数の疫学研究をモデルに、1)被験者の統合を可能にする個人情報管理と匿名化 2)項目の標準化や関連付け、また、論理矛盾の排除を可能にするメタデータ管理 3)それらに基づく追跡調査の効率的な実施 4)データの事後的なキュレーションの支援 5)ユーザの権限に応じたアクセス制御 6)オミックス解析のパイプライン化の仕組みの構築。今後もこれらを継続し、基盤の洗練を図るとともに、コホート事業などで収集した網羅的ゲノム情報やそれに基づくゲノム・オミックス解析を実施し、得られた成果を本年度末に公開する。
番 号 13
タイトル ゲノム情報に基づく植物DBの統合
発表者 市原寿子1)、浅水恵理香1)、中谷明弘2)、平川英樹1)、中村保一1)、田畑哲之1)
所 属 1)かずさDNA研究所 2)新潟大学
要 旨 現在までに全ゲノム解読が論文発表された植物種は30種を超え、その成果はデータベース(以下DB)を通して公開されている。しかし、プロジェクトや研究グループごとに個別のDBが構築され、異なるプラットフォームをもつ多くのDBがウェブ上に散在しており、利用者にとって使いにくい状況となっている。我々は、利用者の統合的な植物ゲノム関連情報の検索と情報取得を効率化するシステム構築を目的として、ゲノム解析が進んでいる55の植物種を選定し、以下の4つの項目に取り組んでいる。
(1)遺伝子オルソログ DB の構築とそれに基づく植物ゲノム DB の統合
  オルソログ DB を構築し、これを「ハブ」として国内植物ゲノムDBをリンクさせる。
(2)DNA マーカーおよび連鎖地図情報に基づく植物ゲノム DB の統合
  文献記載に留まる DNA マーカーや遺伝地図情報を収集・整備する。
(3)植物リソース情報 DB の統合
  NBRPや理研 BRC で収集・提供されている生物リソースに対する横断検索を可能にする。
(4)植物研究に関連する情報基盤の構築
  植物種の学術情報、オミックス解析成果、生態学的情報など多岐にわたる植物データベースに対するリンクを整備・統合する。
番 号 14
タイトル 遺伝子オルソログDBの構築とそれに基づく植物ゲノムDBの統合
発表者 中谷明弘1)、市原寿子2)、浅水恵理香2)、平川英樹2)、中村保一2)、田畑哲之2)
所 属 1)新潟大学 2)かずさDNA研究所 
要 旨 配列の類似関係は、さまざまなゲノムデータベース(DB)のエントリー間を対応付けて横断的な情報検索を実現するための基礎的かつ重要な手がかりとなります。共通の祖先遺伝子から種分岐に伴って派生した遺伝子群はオルソログと呼ばれ、共通した機能や特性を保存していると考えられています。これに基づいて、多くのゲノムDBではBLAST等によるDB内の配列に対するホモロジー検索の機能を備えています。異なる種も含めた複数DBの遺伝子ID検索機能やホモロジー検索機能を互いに接続して横断的な情報検索を実現するシステムがPGDBj/OD (Plant Genome DataBase Japan / Ortholog Database)です。その実現のために、アミノ酸配列プール(NCBI RefSeqの緑色植物の約50万アミノ酸配列)を準備し、そこで全対全のホモロジー情報を予め計算してしまい、それに基づいて類似配列クラスタ(オルソログ)を作成しています。個々のゲノムDB内の遺伝子ID やアミノ酸配列をこのアミノ酸配列プールに対応付け、同一のオルソログに分類されたものを抽出し、それらの元のゲノムDBでのエントリーへのリンクを集計することで横断的な情報検索を実現しています。
番 号 15
タイトル ATTED-II: 植物の遺伝子共発現データベース
発表者 大林武1)、岡村容伸1)、伊藤聡史1)、田高周1)、青木裕一2)、木下賢吾1)
所 属 1)東北大学大学院情報科学研究科 2)東北大学大学院工学研究科
要 旨 ゲノム配列の解読により個々の遺伝子の解析効率は大きく加速したが、システムとしての個体の理解には遺伝子間の関係性を示すネットワークの推定が不可欠である。この遺伝子間の関係性も、個々の遺伝子情報と同様にゲノムに書かれており、タンパク質コード領域にはタンパク質間ならびにタンパク質化合物間の相互作用情報が、制御領域にはmRNA量の同調性の情報が埋め込まれている。我々は公共の大規模遺伝子発現データに基づく遺伝子発現パターンの相同性(遺伝子共発現)を用いて、遺伝子回路そのものを導出することを試みており、その結果、複合体・代謝経路・シグナリング経路を強く反映した遺伝子共発現関係が得られている。遺伝子共発現情報はタンパク質間相互作用データと合わせてネットワーク解析できるように公開している(ATTED-II,http://atted.jp)(動物向けはCOXPRESdb,http://coxpresdb.jp)。近年は特に生物種間の比較ならびにゲノム配列に注目して解析できるように開発を進めており、信頼性と進化的考察に関する機能を中心に、動物・植物研究における共発現利用の展望についても紹介する。
番 号 16
タイトル 微生物統合データベース MicrobeDB.jp
発表者 黒川顕1)、中村保一2)、内山郁夫3)、菅原秀明2)、MicrobeDB.jpプロジェクトチーム1)2)3)
所 属 1)東京工業大学大学院生命理工学研究科 2)情報・システム機構 国立遺伝学研究所 生命情報研究センター  3)自然科学研究機構 基礎生物学研究所
要 旨 ライフサイエンス研究において、知識の集積体であるデータベース(DB)は、知識の参照のみにとどまるものではなく、新たな研究分野を切り拓く上で欠く事のできない極めて重要な研究基盤である。ライフサイエンス研究の中でも、微生物研究は歴史も古く、これまで蓄積されたデータや知識は膨大かつ多岐にわたっている。さらに、ゲノム科学の発展や新型シーケンサーの普及に伴い、ゲノムやメタゲノムなど圧倒的な量のデータが産出されており、これらを横断的にかつ簡便に利用出来れば、新たな仮説や研究分野の創出がより容易になると期待される。これを実現するため、我々は、ゲノム情報を核として、ゲノムと紐付けることが可能な様々な微生物学上の知識を統合し、幅広い分野での微生物学の発展に資することのできる「微生物エンサイクロペディア」の構築を目標として研究開発を行っている。これらデータの統合化は、微生物の体系的な理解を促進し、これまでの仮説検証型の研究のみならず、膨大なデータの中から新たな仮説を導くデータ駆動型の研究を強力に推進する事を可能とする。
MicrobeDB.jpのデモサイト: http://microbedb.jp/MDBdemo/
番 号 17
タイトル 微生物データ統合を目指したオントロジーの開発
発表者 川島秀一1)、岡本忍1)、片山俊明1)、藤澤貴智2)、森宙史3)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター  2)情報・システム研究機構 国立遺伝学研究所 生命情報研究センター 3)東京工業大学大学院生命理工学研究科
要 旨 DBCLSでは、生命科学分野にこれまで蓄積されてきた大量データに対して、メタデータの付与、フォーマットや用語の統一等を行うことで再構築し、利用者がより効率的にデータを活用できる環境の構築に取り組んでいる。具体的には、実証実験として細菌を中心とした微生物に焦点を絞り、既存データのLinked Open Data (LOD) 化や、そのために必要なオントロジーの整備を行い、この目標を実現しようとしている。
本発表では、昨年度から開発を始めた、Microbial Culture Collection Vocabulary (MCCV) と、Microbial Phenotype Ontology(MPO)に関して報告する。生物リソース・センターでは、保存している菌株に関して、菌株名や対応するタクソノミーID、分離源、来歴、生育温度等の情報を整理しているが、MCCVは、そのような菌株データを記述するためのオントロジーである。MPOは、微生物の表現型を記述するためのオントロジーで、Genome Online Database のようなデータベースや、研究論文に記載された、表現型情報のLOD化の際に利用することを想定している。菌株情報、表現型情報ともに、統制された語彙で記述しLOD化することで、ゲノム情報のLODと統合することができ、高度なゲノム情報検索が可能になると考えている。
番 号 18
タイトル 微生物の生息環境データの記述および高度な検索のためのオントロジー構築
発表者 山本希1)、岡本忍2)、川島秀一2)、竹原潤一1)、吉野弘二1)、森宙史1)
MicrobeDB.jpプロジェクトチーム1)3)4)
所 属 1)東京工業大学大学院生命理工学研究科 2)情報・システム研究機構 ライフサイエンス統合データベースセンター  3)情報・システム機構 国立遺伝学研究所 生命情報研究センター 4)自然科学研究機構 基礎生物学研究所
要 旨 多くの環境において単離された菌株のゲノム解析や、微生物群集そのものを解析するメタゲノム解析が盛んに行われている。公共データベースに登録された配列データには、関連情報としてメタデータが記述される。特にサンプルを取得した環境および、宿主の健康状態のメタデータは、微生物の生息環境を表す重要な記述である。解析データを他のデータと比較する際、これらのメタデータは生物学的知見を見いだす上で重要となる。しかし、公共データベースでは用語や記述が統一されていないため、目的データの探索が困難となっている。
本研究では、微生物の生息環境を示す語句の意味や、語句間の関係性を表すオントロジーを構築した。環境についてはMEO(Metagenome/Microbes Environment Ontology)を、疾病や症状についてはPDO(Pathogenic Disease Ontology)とCSSO(Clinical Signs and Symptoms Ontology)を構築した事で、同義語検索や推論検索が可能となった。これらを開発した統合データベース『MicrobeDB.jp』に組み込む事で、データの柔軟な検索が可能となる。
番 号 19
タイトル 微生物ゲノムデータベース MBGDのデータ構築戦略
発表者 内山郁夫1)、千葉啓和1)、西出浩世1)、三原基広2)
所 属 1)自然科学研究機構 基礎生物学研究所 2)ダイナコム
要 旨 MBGDは多様な微生物のゲノム情報をオーソログ関係に基づいて整理し比較するためのデータベースである。近年の爆発的なゲノム情報の蓄積により、利用可能なゲノムすべてを同時に比較することは非現実となりつつあり、データ構築戦略の練り直しが求められている。MBGDでは、全系統をカバーする代表生物種から作成される「標準オーソログ表」と、系統群ごとのより詳細な「系統群特異的オーソログ表」を事前計算して保持しており、これに利用者の選んだゲノムを追加していくことにより、様々な用途に耐えうるデータベースとすることを目指している。特に、近年ドラフト状態のゲノムデータが急速に蓄積しているので、利用者自身が決定したものも含め、不完全なゲノムを取り込んで比較する機能を作成している。一方、こうした不完全なデータの解析基盤として用いるためには、標準オーソログ表の品質も重要になってくる。MBGDにおけるオーソログ分類手法DomClustは、融合タンパク質を適切に扱うためのドメイン分割処理を含んでいるが、その精度に問題があるケースもある。そこで、マルチプルアライメントを用いてドメイン分割の精度を改善する手続きも開発した。
番 号 20
タイトル セマンティックWeb技術を用いたオーソログデータベース統合化の試み
発表者 千葉啓和、西出浩世、内山郁夫
所 属 自然科学研究機構 基礎生物学研究所
要 旨 ゲノム配列データは近年急速に増加し続けており、これらを効率よく相互に比較し解析を行うための基盤として、オーソログ情報を活用したデータ統合環境が求められている。我々は、微生物比較ゲノムデータベースMBGDの提供するオーソログデータをRDF化するとともに、Webサービスを立ち上げてSPARQL検索が可能な環境を整えた。このようなセマンティックWeb技術に関しては、他の微生物DBグループと協調して適用を進めてきた。その結果、現在ではSPARQLエンドポイントへのネットワーク越しの問い合わせによって、オーソログデータと他の様々な情報とを容易に統合して利用することが可能となっている。さらに、MBGDにおけるRDF記述から、一般的にオーソログの記述に必要な概念を抽出し、オーソログオントロジーとして構造化した。このオントロジーは、多数の記述方法が存在するオーソログ情報に対する標準化の試みとしても貢献できると考えている。
番 号 21
タイトル Genome Refine: 微生物ゲノム基盤情報ならびにアノテーションリファレンスのRDFを活用したゲノムアノテーションサービス開発
発表者 藤澤貴智1)、森宙史2)、岡本忍3)、山本泰智3)、片山俊明3)、谷澤靖洋1)、神沼英里1)、大山彰4)、菅原秀明1)、内山郁夫5)、 黒川顕2)、中村保一1)
所 属 1)情報・システム研究機構 国立遺伝学研究所 生命情報研究センター 2)東京工業大学大学院生命理工学研究科  3)情報・システム研究機構 ライフサイエンス統合データベースセンター 4)インシリコバイオロジー株式会社  5)自然科学研究機構 基礎生物学研究所
要 旨 MicrobeDB.jpプロジェクトでは、セマンティックウェブ技術を用いて微生物のデータベースおよびデータの統合化を進めている。これまで、生物情報を統合する上で重要な基盤となるゲノム情報およびそのリファレンス情報資源の整備に取り組んできた。DBCLSと連携して、ゲノム基盤情報および関連情報のRDF化とオントロジーの開発を行なってきた。
我々は、ゲノム解析のサポートを目的として、これらのリソースを活用したゲノムアノテーションのサービスGenome Refineを開発している。本サービスは、解析パイプラインMiGAPの解析結果であるゲノム情報およびメタデータを入力として、ゲノムアノテーションのためのデータベース環境と形式変換サービスを提供する。また、テキストマイニング技術を用いた自動アノテーション精度向上、TogoAnnotationを利用したゲノムアノテーション手動編集、環境情報マッピングなどの高度な解析を実施するMicrobeDB.jpとサービス連携に取り組んでいる。本サービスの基盤情報およびOpenID認証サーバを介した連携サービスについて報告する。
番 号 22
タイトル ゲノム・メタゲノム解釈ツールKEGG Mapper
発表者 田辺麻央1)2)、松浦有里子2)、久原侑子2)、金久實1)2)
所 属 1)京都大学化学研究所 2)NPOバイオインフォマティクス・ジャパン
要 旨 KEGG Mapper (http://www.kegg.jp/kegg/mapper.html) は、KEGGのネットワーク情報 (KEGG PATHWAY, KEGG BRITE, KEGG MODULE) を利用して、ゲノムやメタゲノムをはじめとしたハイスループット実験データの生物学的意味解釈を支援するツールです。このツールの一部機能はKEGGプロジェクト当初より提供されていましたが、ライフサイエンスデータベース統合推進事業において、数値データをパスウェイマップ上に3次元表示する機能など、大幅な機能拡張を行いました。ここではKEGG Mapperの利用例を2つ紹介します。1つはがんパスウェイマップ(05200番台のマップ番号)を用いたがんゲノム解析で、がん細胞での遺伝子変異頻度データや遺伝子発現データの解釈に利用する例です。もう1つは代謝グローバルマップ(01100番台)と新しい代謝オーバービューマップ(01200番台)、およびKEGG MODULEを用いて、ゲノムやメタゲノム中の遺伝子に付与されたアノテーション(KEGG OrthologyのK番号)からフェノタイプを推定する利用例です。
番 号 23
タイトル KEGG MEDICUSとお薬手帳
発表者 米納朋子1)2)、永吉ふみ2)、金久實1)2)
所 属 1)京都大学化学研究所 2)NPOバイオインフォマティクス・ジャパン
要 旨 KEGG MEDICUS (http://www.kegg.jp/kegg/medicus/) は疾患・医薬品・環境物質など社会的ニーズの高いデータを、ゲノム情報を基盤とした生体システム情報として統合したリソースです。研究者コミュニティだけでなく、医療従事者や一般の人々にも有用なリソースとして開発・提供してきました。具体的には疾患関連遺伝子や医薬品標的分子をKEGGパスウェイと対応づけ、併用禁忌や併用注意に関する医薬品添付文書情報から医薬品相互作用データベースを作成してきました。また異なるニーズに対応できるように、主に研究者向けの英語版インターフェース、医療従事者に適した日本語版インターフェース、一般向けのKEGGお薬手帳を開発しました。本発表ではとくにKEGGお薬手帳を通してKEGG MEDICUSの紹介をします。KEGGお薬手帳は「自分の健康は自分で守る」という意識改革を目指した取り組みでもあり、自分が使っている薬に対して科学的知識を提供することが目的です。とくに医薬品同士の相互作用などがKEGGの医薬品相互作用データベースで自動的にチェックされる機能も含まれています。
番 号 24
タイトル TargetMine, a data warehouse system for target discovery
発表者 陳怡安、ロケシュ・テリパチ、水口賢司
所 属 医薬基盤研究所 創薬基盤研究部 バイオインフォマティクスプロジェクト
要 旨 For the purpose of drug discovery, we have developed TargetMine, an integrated data warehouse, which is based on the flexible InterMine framework and which effectively combines biological data from several public resources [1]. TargetMine enables biological data gathering and data analysis in a single user-friendly interface and is, thus, a useful tool to assist candidate gene selection. In addition to keeping the data sources up to the date, we aim to incorporate new resources providing additional biological associations, which maybe be useful in target discovery. For instance, we have now included within TargetMine, miRNA data from miRBase and miRNA-gene interactions from miRTarBase. TargetMine has been effectively employed for target selection in a protein-protein interaction (PPI) network-based analysis of Hepatitis C virus (HCV) pathogenesis [2,3,5] and lung tumorigenesis [4]. The academic version of TargetMine is freely available at http://targetmine.nibio.go.jp .
文献:
1. Chen YA, Tripathi LP, Mizuguchi K (2011) TargetMine, an Integrated Data Warehouse for Candidate Gene Prioritisation and Target Discovery. PLoS ONE 6(3): e17844.
2. Tripathi LP, et al. (2010) Network based analysis of hepatitis C virus Core and NS4B protein interactions. Mol Biosyst 6: 2539-2553.
3. Tripathi LP, et al. (2012) Proteomic analysis of hepatitis C virus (HCV) core protein transfection and host regulator PA28γ knockout in HCV pathogenesis: A network-nased study. J Proteome Res 11: 3664-3679.
4. Ihara S, et al. (2012) Inhibitory roles of signal transducer and activator of transcription 3 in anti-tumor immunity during carcinogen induced lung tumorigenesis. Cancer Res. 72, 2990-2999.
5. Tripathi LP, et al. (2013) Understanding the Biological Context of NS5A-Host Interactions in HCV Infection: A Network-Based Approach. J Proteome Res.
番 号 25
タイトル Toxygates,トキシコゲノミクスデータとlinked data の統合解析プラットフォーム
発表者 五十嵐芳暢1)、Johan T.Nystrom-Persson2)、森田瑞樹2)3)、伊藤真和吏2)、中津則之1)
山田弘1)、水口賢司2)
所 属 1)医薬基盤研究所 創薬基盤研究部 トキシコゲノミクス・インフォマティクスプロジェクト  2)医薬基盤研究所 創薬基盤研究部 バイオインフォマティクスプロジェクト  3)産業技術総合研究所 ヒューマンライフテクノロジー研究部門
要 旨 薬剤を動物や細胞に暴露して遺伝子の発現変化を網羅的に測定した遺伝子発現プロファイルは、遺伝子レベルの毒性発現メカニズムの解明や毒性予測に役立つ。2002 年度から 10 年間継続された官民共同トキシコゲノミクスプロジェクトで取得された遺伝子発現プロファイルは、Open TG-GATEs を通して公開されている。我々はこのデータをより使いやすくするために、遺伝子発現プロファイルの解析システムを実装した。本解析システムでは任意の複数遺伝子を、時系列や用量変化に沿った発現変動パターンの類似性によってスコア化し、化合物を類似の遺伝子変動パターン順にランキングすることができる。この機能によって、同じような毒性発現メカニズムを持つ化合物の候補を順位付けすることができる。同時に Open TG-GATEs のDF化を行い、ChEMBL や DrugBank、KEGG 等の外部データベースとの SPARQL を介した統合を行った。また、病理所見情報や血液学および生化学情報も統合化した。Toxygates はhttp://toxygates.nibio.go.jp を通して公開されている。
番 号 26
タイトル NITEの化学物質管理に関する公開データベース
発表者 高橋和博、吉田しのぶ、小原裕子
所 属 製品評価技術基盤機構 化学物質管理センター 情報業務課
要 旨 化学物質は、我々の生活において欠かせないものである一方、安全で安心できる社会生活の実現のためには、化学物質のリスクを適切に管理し、リスクコミュニケーションにより関係者や一般市民の理解を進める必要がある。
独立行政法人製品評価技術基盤機構(NITE)化学物質管理センター(以下、当センターと略)では、科学的知見や法令・国際ルールに基づいた化学物質管理業務として、化審法、化管法の法律の施行等に関するリスク評価手法の開発等も含む技術的支援業務のほか、それらの法律に関係する情報をはじめ化学物質に関する安全性情報などをウェブサイトから提供している。
これら当センターが提供している情報のうち、化学物質管理のための無料データベース「化学物質総合情報提供システム」(CHRIP:CHemical Risk Information Platform(クリップ))の紹介と検索方法、得られる情報等について紹介する。
さらに、GHS関連情報、J-CHECK、「化学物質と上手につきあうには」(わかりやすい解説のページ)、NITEケミマガ(化学物質関連情報のメールマガジン)についても紹介する。
番 号 27
タイトル 分子構造による糖鎖関連物質の検索システム
発表者 藤田典昭1)、鹿内俊秀1)、鈴木芳典1)、山田一作2)、成松久1)
所 属 1)産業技術総合研究所 糖鎖医工学研究センター 2)野口研究所 糖鎖有機化学研究室
要 旨 我々は文部科学省やJST/NBDCの統合データベースプロジェクトに参加し、一貫して糖鎖関連データベースの統合を推進してきた。
当初は生物学者用の検索インターフェースを重点的に開発してきた。研究者から話を聞くうちに、生物学者間ではよく利用する米国のコンソーシアムの単糖シンボルを利用して構造を検索する化学者が少ないことを知った。生物学者と化学者が同じ実験や論文のデータを検索できるようにすることは両分野のユーザ利便性向上やデータへのアクセシビリティを高めることにつながる。化学者のニーズに応えるために、既知の糖鎖構造DB、配糖体DB、単糖のDBや、野口研の保有する有機化学による糖鎖合成基質・生成物DBなどの構造に関するDBを統合化した。統合化したDBに対して、MOLやInChIなどで表現できる分子構造をクエリーとして統合検索を実現した。最近では、蓄積した合成反応を組み合わせて、合成物収率やアイソマーの比などを考慮して化学合成のための経路選択ができる支援ツールを開発した。今後も化学者のニーズを取り込みながら機能の向上とユーザフレンドリーなインターフェースに改良を行っていく予定である。
番 号 28
タイトル 遺伝的要因の関与する糖鎖関連疾患に関するオントロジーの開発
発表者 ソロビヨワ・イェレナ、鹿内俊秀、藤田典昭、成松久
所 属 産業技術総合研究所 糖鎖医工学研究センター
要 旨 産総研・糖鎖センターでは、NBDCの統合化推進プログラムの中で、糖鎖の統合化を推進している。我々は、「糖鎖関連疾患とその原因遺伝子のデータベース(GDGDB)」を構築し、2010年4月から公開している。現在約80にも及ぶ病名や原因遺伝子についての情報が収録されている。糖鎖関連遺伝子の変異によって引き起こされる疾患及び遺伝子の情報を提供している。そこで、利用者により分かりやすい情報提供を行うためには、糖鎖研究側からの観点により、疾患を分類し、その分類に基づいたオントロジーを構築することで、疾患の病因・メカニズム・症状等への理解を深めることができると考えられる。我々は、糖代謝や糖鎖の種類に着目し、「Genetic Glyco-Diseases Ontology」の開発を開始した。本オントロジーでは、米国国立医学図書館が開発した統合医学用語システム(UMLS)で提供されている医学用語を用いている。UMLSに登録されているMeSH、ICD等シソーラスの医学用語はコンセプトとして整理されており、コンセプトの概念識別子を本オントロジーに記載した。これまでのオントロジー開発の進歩について報告する。
番 号 29
タイトル GlycoScience Protocol Online Database
発表者 川嵜敏祐1)、前田真砂子2)、鴨さおり1)、富永知子1)、石崎円2)、鹿内俊秀2)、伊東信3)
亀山昭彦2)、工藤崇4)、鈴木匡5)、千葉靖典2)、西原祥子6)、平林淳2)、渡辺秀人7)、渡辺里仁6)
奥田修二郎1)、文紅玲2)鈴木芳典2)、藤田典昭2)、野村しのぶ2)、伏見美峰2)、成松久2)
所 属 1)立命館大学 2)産業技術総合研究所 糖鎖医工学研究センター 3)九州大学 4)筑波大学 5)理化学研究所 6)創価大学 7)愛知医科大学
要 旨 近年、本来持っているタンパク質の機能を解析するためには、糖鎖修飾の情報を含めて研究を進めることが必須になってきました。しかしながら、研究者が糖鎖研究を始めようとしても実験の技術的な問題の壁に当たることが多いことが言われております。参考にする論文のマテリアルズ&メソッズに記載の実験方法でも省略されている操作が多く、時間をかけて調べることが必要でした。そのようなことから、我々は専門家たちの蓄積された実験の知識とスキルをオンラインで提供し、常に新しい情報を提供できるように実験科学のプロトコル集(GlycoPOD)を構築しました。また、より幅広い周辺領域への糖鎖科学の普及と応用を掲げ、活動を行っております。GlycoPODに収載する際には、実験を行い成功した現役の研究者にプロトコルの執筆をお願いし、実験に関する全ての情報を提出して頂き、我々がそれらを集約しデータベース化しました。可能な限り統一された表示形式を採用し、実験の手順はフローチャート形式で見やすく配置し、中には成功のための貴重な専門家のコメントとして掲載しております。また、専門家への直接問い合わせ機能も実装しており、近日その情報交換機能の運用を開始する予定です。この事業は、JST/NBDCの統合化推進プログラムにより支援を受けております。
(公開中のプロトコル数:205 協力頂いた研究者数:195名)
番 号 30
タイトル 日本糖鎖科学コンソーシアム・データベース(JCGGDB)の機能拡充
発表者 鹿内俊秀、鈴木芳典、藤田典昭、ソロビヨワ・イェレナ、前田真砂子、文紅玲、石崎円、新町大輔、
澤木弘道、梶裕之、成松久
所 属 産業技術総合研究所 糖鎖医工学研究センター
要 旨 我々は、JST/NDBCの統合化推進プログラムに参加し、糖鎖科学統合データベース(JCGGDB)の検索の利便性向上とデータの統合のための技術開発を行っている。
これまでに、5つの検索インターフェースを開発し、検索目的に応じて糖鎖関連DBを検索できるようになった。最近では、複数の糖鎖構造を組み合わせて検索できる機能や、糖鎖構造名などの表記の揺らぎを吸収しながらDB検索(プロトタイプ)できる機能を公開した。より最新の情報を充実させるために産総研の糖タンパク質の実験データを取り込み、公開の準備を進めている。さらに、これまでの情報基盤を活用し、アジア・欧米のグループとの連携や作業も着実に進めている。
今年度までに、直観的に利用できる統合化されたインターフェースの完成を目指し開発を行う予定である。
番 号 31
タイトル GlycoNMR Database
発表者 山田一作1)、徳岡慶治1)、松原正陽1)、大野俊恵1)、弘瀬友理子1)、水野真盛1)、山口芳樹2)
藤田典昭3)、鈴木芳典3)、鹿内俊秀3)、成松久3)
所 属 1)野口研究所 糖鎖有機化学研究室  2)理化学研究所 ・マックスプランク連携研究センター システム糖鎖生物学グループ 糖鎖構造生物学研究チーム  3)産業技術総合研究所 糖鎖医工学研究センター
要 旨 核磁気共鳴(NMR)法は、核酸、タンパク質、糖鎖など様々な分子の立体構造や相互作用の解析に有効である。近年のNMR装置の高磁場化に伴い、糖質に関する高分解能NMRスペクトルのデータも多く報告されるようになってきた。しかし、研究毎に目的が異なり、測定条件等が均質でないためスペクトルデータを比較することは容易ではなかった。そこで、標準測定条件を定めた上でNMRスペクトルデータを収録したNMRスペクトルデータベースを開発した。本データベースは、化学シフト、カップリング定数、シグナル帰属の一覧表とスペクトルデータ、化学構造式、測定条件などを収録している。また詳細画面により、NMRスペクトルを任意に拡大縮小可能であり、複雑に重なりあった糖のスペクトルを表示する際に有効である。また、各種検索機能により目的とする糖質を検索することが可能である。
番 号 32
タイトル RIKEN Glycan Confromation DataBase (RGCDB)
発表者 加藤雅樹、山口芳樹
所 属 理化学研究所 マックスプランク連携研究センター システム糖鎖生物学グループ 糖鎖構造生物学研究チーム
要 旨 糖鎖は一般にタンパク質や脂質に結合しており、生体内で細胞間のコミュニケーションやタンパク質のフォールディング等の様々な機能を果たしている。
核酸やタンパク質と異なり、糖鎖には複数の結合様式が存在し、分岐構造をとり得るために複雑である。さらに、糖鎖を構成している単糖(グルコースやマンノース等)は水酸基の立体化学の違いにより定義されており、そのわずかな違いが機能と密接関係している。特に、糖鎖-タンパク質間の相互作用解析や糖鎖の機能解析においては糖鎖の立体構造に関する知見は重要である。そこで我々はProtein Data Bank(PDB)に登録されている糖鎖および糖タンパク質、糖鎖関連酵素やレクチンの立体構造情報を収集し、RIKEN Glycan Conformation DataBase (RGCDB)を構築した。本データベースでは、収集したデータの糖鎖の立体構造、糖鎖付加部位に関する基本情報とそれらを解析して得られた統計情報(グリコシド結合周りの2面角およびリングのパッカリング)を提供している。PDBに登録されている糖鎖には誤りが存在していることが知られているが、その誤りに関する情報も提供している。
番 号 33
タイトル PosMed: フェノタイプ情報と文献の統合によるバイオリソースの推論検索
発表者 蒔田由布子1)、小林紀郎1)、吉田有子1)、土井考爾1)、望月芳樹1)、西方公郎1)、松嶋明宏1)
高橋聡史1)、石井学1)、高月照江2)、 桝屋啓志2)、豊田哲郎1)
所 属 1)理化学研究所 情報基盤センター 統合データベース特別ユニット 2)理化学研究所 バイオリソースセンター
要 旨 PosMed(ポスメド, http://biolod.org/PosMed/)は、ユーザが指定したキーワードから文献を経由することで、ヒットした文献に記載されている遺伝子やマウスリソースをキーワードとの関連度でランキングするウェブアプリケーションです。直接マウスリソースが使われている文献に限らず、ノックアウトされた遺伝子のフェノタイプ情報を含む別の文献も活用して間接的にもマウスリソースを提案します。またPosMedの遺伝子検索においては、ゲノム領域やID群を指定して、文献経由で遺伝子を検索することもでき、ポジショナルクローニングやNGSによるエキソーム解析などをイン・シリコで支援します。
PosMedでは、約1000万件の文献やアノテーション情報(遺伝子やバイオリソースなど)、オントロジー、共発現情報やパスウェイなどを総動員して最適な結果を瞬時にマイニングします。その検索精度は、人手による文献・遺伝子の関係づけなどの地道な作業で維持されています。また膨大なドキュメント同士の関係は、RIKEN SciNetSに登録したセマンティック・ウェブデータを利用しています。現在までにヒト、マウス、ラット、シロイヌナズナ、ライスの5生物種でサービスを提供しています。
番 号 34
タイトル Metabolonote: メタボロミクスのデータリソースを統合するメタデータ専用管理システム
発表者 荒武1)、榎本光男1)、西岡孝明3)、有田正規2)、金谷重彦3)、櫻井望1)
所 属 1)かずさDNA研究所 2)理化学研究所 植物科学研究センター 3)奈良先端科学技術大学院大学情報科学研究科
要 旨 代謝産物を網羅的に検出するメタボロミクスのデータには、サンプル調製や分析機器の設定条件など、膨大な詳細情報(メタデータ)が付帯する。メタボロミクスのデータベースを開発し、データを速やかに登録、公開して、研究者がデータを高度に利用できる環境を構築するには、メタデータの効率的な管理が鍵となる。そこで我々は、複雑なメタデータを実験データから切り離して一元管理し、これを実験データを扱う複数のデータベース間で共有できる、メタデータ管理専用のデータベースMetabolonote(webs2.kazusa.or.jp/metabolonote)を開発した。Semantic MediaWikiをもとに開発したMetabolonoteは、サンプル、機器分析、データ解析といったメタデータの階層構造を管理でき、それぞれの情報にアクセスできる簡潔なID体系と、意味的検索のためのAPIを実装している。これらの機能を使い、Metabolonoteをハブとして用いることで、国内の複数のメタボロミクスのデータリソースの統合を進めることができた。
番 号 35
タイトル BDML: 生命動態システム科学の定量データを記述する言語
発表者 ホー・ケネス、京田耕司、遠里由佳子、大浪修一
所 属 理化学研究所 生命システム研究センター 発生動態研究チーム
要 旨 生命を動的システムとして理解するためには、分子、細胞、個体の時空間動態に対する定量データの解析が必須である。今までに、これらの生命動態データを表示、編集、解析するための様々なツールが開発されてきた。しかしながら、各ツールは独自のデータ形式を採用しているため、他のデータに適用することができなかった。そこで本研究では、動態データを統一的に記述するためのデータ形式、Biological Dynamics Markup Language(BDML)を開発した。BDMLは、XMLを基盤とするデータ形式である。BDMLの開発により、動態データに対するツールの共有、ツールの効率的な開発と評価が可能になる。さらに、動画像からの計測データとシミュレーションからの計算結果の比較や、異なる生物種の動態データの比較などの解析が容易になることが期待される。
番 号 36
タイトル 生命動態システム科学の統合データベースの開発
発表者 遠里由佳子、京田耕司、ホー・ケネス、大浪修一
所 属 理化学研究所 生命システム研究センター 発生動態研究チーム
要 旨 生命現象を動態システムとして理解するためには、先端計測技術により得られる時・空間情報を有する定量データの解析と、数理科学的手法によるモデリングの融合が重要である。しかし、現時点でそのような時・空間定量データを公開している国内外のデータベースでは、それぞれが独自のデータ形式を採用しており、モデリングとの融合等の技術開発の効率が悪い。そこで本研究では、生命動態にかかわる動画像と、それらより得られた定量データを包括的に管理するデータベースを構築した。定量データとそれを取得するのに要したアルゴリズムの情報は、XML形式(BDML: Biological Dynamics Markup Language)で統一的に記述されている。動画像はOMERO技術を基盤に格納した。そして、大腸菌からマウスに至る様々なモデル生物を対象に、分子・細胞・個体レベルの多岐にわたる動態データを収集した。それらのデータは、ブラウザ上で検索および表示することができ、さらには、表現型を定量的に解析するツールを適用することができる。現在、フェノーム統合データベースをはじめとする他の統合データベースとの連携も試みている。
番 号 37
タイトル WDDD: 線虫C. elegans初期胚の定量細胞分裂ダイナミクスデータベース
発表者 京田耕司、岡田初美、杉本伴子、辺見健一、矢代志穂子、大浪修一
所 属 理化学研究所 生命システム研究センター 発生動態研究チーム
要 旨 動物の発生過程で機能する個々の遺伝子の発現を網羅的に摂動させた際の形態ダイナミクスを定量的に計測することは、発生過程における分子機構を理解するために重要である。我々は、線虫C. elegans初期胚をモデルとして、胚発生に必須である遺伝子の機能をRNAi法により阻害した際の細胞分裂ダイナミクスを定量的に計測し、これらの定量情報を公開するためのWorm Developmental Dynamics Database (WDDD)を構築した。細胞分裂ダイナミクスは、4次元微分干渉顕微鏡画像に画像処理と物体追跡の技術を適用することにより、核領域の輪郭とその繋がりを表現した数値情報として計測している。現在、野生胚50個体、第3染色体上の72遺伝子に対するRNAi胚136個体の細胞分裂ダイナミクスの定量情報および顕微鏡画像を公開している。今後、全染色体を対象として胚発生に必須である約350遺伝子に対するRNAi胚5個体の細胞分裂ダイナミクスの定量情報を、順次公開する予定である。さらに、表現型解析など定量データを解析する手法を開発しており、これらの解析結果も公開する。
番 号 38
タイトル PDBjとwwPDBにおける蛋白質構造データ統合化
発表者 中村春木1)、金城玲1)、村上洋一2)、木下賢吾2)
所 属 1)大阪大学蛋白質研究所 2)東北大学大学院情報科学研究科
要 旨 日本蛋白質構造データバンク(Protein Data Bank Japan: PDBj, http://pdbj.org/)では、日米欧からなる国際蛋白質データバンク(wwPDB: http://wwpdb.org/)の一員として、主にアジア・オセアニア地域を対象に、蛋白質等の生体高分子立体構造データの登録・管理・公開・解析サービスを実施し、独自に開発した検索システムやリガンド結合部位の局所構造・分子表面の類似性検索など、様々な解析ツールを無償で公開している。特に、本統合化プログラムによりsemantic webの基盤となるPDB/RDFを開発し(http://rdf.wwpdb.org/pdb/, Kinjo et al. (2012) Nucl. Acids Res. 40, D453-D460)、wwPDBの国際標準フォーマットとして毎週updateを行って運営している。この仕組みの応用として、蛋白質のリガンド(低分子化合物、蛋白質、核酸)結合部位の基本構造モチーフやそれらの組み合わせによる複合構造モチーフの同定、さらにUniProtとの連携について、最近の開発事例を紹介する。
番 号 39
タイトル 生体高分子NMRデータベース、 BMRBにおけるデータベース統合化の新展開
発表者 小林直宏、横地政志、岩田武史、高橋あみ、児嶋長次郎、藤原敏道
所 属 大阪大学蛋白質研究所
要 旨 PDBj-BMRBグループは米国BMRBおよびwwPDBと連携して、NMRデータベースであるBioMagResBank(BMRB)の開発、および登録・公開拠点としてサイトの構築運営を行っている。米国Wisconsin大学と共同でサービスを提供しているBMRBミラーサーバーではデザインの一新を行い、データの可視化ツールを充実させることで登録者のNMR実験データを分かりやすく確認できる機能を行っている。独自に開発した支援ツールのNMRデータの解析支援ツールであるMagRO、本年度において開発されたNMR-STAR形式からXML形式へとファイルの変換を行うBMRBxToolの提供を開始している。更にBMRBの全エントリーのXMLRDF化、RDF化を行い、データベース統合化へ向けてドキュメントの公開を開始した。
番 号 40
タイトル ヒト転写産物統合データベースH-InvDBのプロテオミクスへの利用
発表者 世良実穂1)、長井陽子2)、村上勝彦1)、羽原拓哉1)、今西規1)2)
所 属 1)産業技術総合研究所 創薬分子プロファイリング研究センター 2)東海大学 医学部 基礎医科学分子生命科学
要 旨 H-Invitational Database (H-InvDB)はヒトの遺伝子と転写産物を対象とした統合データベースである。ヒトの全転写産物を対象として、遺伝子の構造・選択的スプライシング・機能性RNA・タンパク質としての機能・機能ドメイン・細胞内局在・代謝経路・立体構造・疾病との関連・遺伝子多型(SNP、マイクロサテライト等)・遺伝子発現プロファイル・分子進化学的特徴・タンパク質間相互作用・遺伝子ファミリー などの精査されたアノテーション(注釈付け)情報を提供している。H-InvDBの特長として、既知の転写産物との相同性に基づいて転写産物や遺伝子座に信頼度指標(Category)を付与している。最新のH-InvDB8.3で定義されたタンパク質コード遺伝子座36,789件のうち、機能が推測可能なCategoryI~IIIは23,469件であり、機能未解明の遺伝子座は13,320件と約30%を占めている。
昨年我々は、これらタンパク質コード遺伝子座のデータをよりプロテオミクス研究に利用しやすい形に発展させたH-Inv Extended Protein Database (H-EPD)を公開した。H-EPDではH-InvDBに加えてRefSeq Protein・UniProtKB/Swiss-Protのタンパク質情報も取り込み、総計44,016件のデータセットとして提供している。既存のH-InvDBと合わせて、遺伝子・転写産物・タンパク質それぞれのカタログとして、さらに広く研究者に利用されるデータベースを目指している。
番 号 41
タイトル DDBJ
発表者 中村保一、神沼英里、小笠原理、大久保公策、高木利久
所 属 情報・システム研究機構 国立遺伝学研究所 生命情報研究センター
要 旨 日本DNAデータバンク(DDBJ)は、米国NCBI、欧州EBIとともにInternational Nucleotide Sequence Database Collaboration(INSDC)を構成する一員である。INSDCの枠組みでは伝統的な配列アーカイブであるDDBJ/GenBank/EMBL-Bankの他に、Sequence Read Archive(SRA)、Trace Archive、研究プロジェクトとプロジェクトに由来するデータベースとしてBioProjectを運営している。目下、NBDCとの連携のもと、欧米の EGA、dbGAPに相当する表現型/遺伝子型解析データアーカイブとして、制限アクセス機能を有する Japanese Genotype-phenotype Archive(JGA)を立ち上げており、INSDCに登録された実験データを得るために使われたサンプル情報を集中管理するBioSampleデータベースの開発も実施している。このポスターでは DDBJ/INSDC の取り組みの報告と今後の展望について紹介する。
番 号 42
タイトル DBCLS SRA: 公共NGSデータの再利用促進技術開発
発表者 大田達郎、仲里猛留、坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨 ライフサイエンス統合データベースセンター(DBCLS)ではNCBI、EBI、DDBJによって管理されている次世代シーケンス(NGS)の公共データベースであるSequence Read Archive(SRA)に登録されたデータの二次利用を促進するための技術開発を行なっている。大量のNGSデータを研究者にとっての有用なリソースとするため、DBCLS SRA(http://sra.dbcls.jp/)では、登録されているNGSデータに対して文献情報や関連する疾患情報などの外部リソースや、独自に計算したシーケンシングデータの情報を統合することで、検索性とデータの信頼性を向上させた。さらに、登録されたデータを対象として種々の統計を行い、その結果を通して関連研究分野におけるトレンドを可視化することにより、急速に発展するNGSの技術とその応用に対してフィードバックを行うことを試みている。本発表では、これまでの取り組みとその成果に留まらず、今後のNGS技術の発展を見据えた公共データの役割についても議論したい。
番 号 43
タイトル 遺伝子発現リファレンスデータセット RefEx
発表者 小野浩雅、坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨 RefEx (Reference Expression dataset)は、4つの異なる実験手法(EST、GeneChip、CAGE、RNA-seq)によって得られた40種類の正常組織における遺伝子発現量を並列に表現することで、手法間の比較とともに各遺伝子の発現量を直感的に比較することが可能なリファレンス(参照)データセットである。検索インターフェースおよび検索結果の表示方法を改良し、複数の選択項目やキーワードなどを同時検索可能なアドバンストサーチ機能を実装したほか、検索結果の絞込み機能を拡張することで検索性の向上を図った。また、検索結果一覧からユーザが任意で選択した遺伝子について「リスト」に保持しこれらを並列に表示する機能を実装し、異なる検索条件で得られる遺伝子の発現状況を容易に比較することが可能となった。さらに、ヒトRNA-seqデータを更新し、より広範囲かつ高精度な発現データを閲覧できるようになった。今回の発表では、RefExの開発状況や今後の展望について紹介し、実験生物学者が真に必要とする遺伝子発現リファレンスDBを開発するために多くの意見や要望を得る機会としたい。
番 号 44
タイトル 統合遺伝子検索GGRNA ver.2
発表者 内藤雄樹、坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨 GGRNA(http://GGRNA.dbcls.jp/)は、遺伝子や転写産物をGoogleのように検索できるウェブサーバである。あらゆるキーワードや塩基配列・アミノ酸配列をひとつの検索窓に入力するだけで、NCBI RefSeqに登録された転写産物をすばやく探し出すことができる。本年7月に公開した新バージョンでは、検索インデックスをメモリではなくSSDに載せて検索する方法に変更し、データベース容量の制約が大幅に緩和された。これにより、従来のGGRNAで提供してきた13種のモデル生物に加え、RefSeqに配列が収録されている全ての生物種を一度に検索できるようになった。また、塩基配列の検索については、高速配列検索GGGenome(http://GGGenome.dbcls.jp/)を新たに構築してGGRNAと連携させた。これらのサービスはREST APIを完備しており、他のデータベースやソフトウェアとも容易に連携できる。生命科学あるいは医学薬学研究のさまざまな場面で活用できるこれらのツールを紹介したい。
番 号 45
タイトル カイコ機能アノテーションパイプラインの構築とその応用
発表者 坊農秀雅1)、小野浩雅1)、天竺桂弘子2)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター 2)東京農工大学
要 旨 パーキンソン病(Parkinson’s disease; PD)では、症状の進行に伴って血液中の尿酸量が減少することが報告されているが、その理由はこれまで不明だった。PD研究で用いられている生物種には、尿酸代謝系に異常を持つ変異体は発見されていなかった。そこで、カイコ遺伝子発現大規模解析手法「カイコ遺伝子機能アノテーションパイプライン」を開発し、PDの症状に似た特徴があり、なおかつ尿酸代謝系に異常を持つユニークなカイコ変異体系統のDNAマイクロアレイデータを解析した。その結果、このカイコ変異体系統ではPD原因遺伝子の1つが尿酸代謝を制御している可能性が示唆され、これまで知られていなかった尿酸代謝調節機構を発見した。発見したカイコ変異体系統は、PDモデル動物として応用できる可能性が高く、今後の医薬品および治療法の開発が促進される。
参考論文: Tabunoki, H., Ono, H. et al. PLOS ONE 8(7): e69130. (2013) doi:10.1371/journal.pone.0069130
番 号 46
タイトル 農畜産物ゲノム研究推進のための情報解析パイプライン構築
発表者 田中剛、熊谷真彦、伊藤龍太郎、沼寿隆、伊藤剛
所 属 農業生物資源研究所 農業生物先端ゲノム研究センター ゲノムインフォマティックスユニット
要 旨 DNA配列解読装置を中心とする解析機器の劇的な進歩により、個別の研究室レベルでも大量の情報を取得し得るようになった。このような膨大なデータの効率的な処理は、現代的な生命科学の研究を進める上で無くてはならない存在である。これは農畜産物に係る農学系の研究分野でも全く同様であり、日本が中心となって2004年に全ゲノム塩基配列解読を宣言したイネに続き、トウモロコシ、ダイズといった主要穀類やカイコ、ブタのゲノム、また、これら生物種のcDNAなど、農業上重要な様々な生物において大量の塩基配列が生産され、関連するデータベースが整備されてきた。現状ではこういった塩基配列情報が遺伝子情報の蓄積や分子マーカーを用いた品種開発を加速しており、また、高速シーケンサーによる更なるデータ生産を促している。我々は、このような大規模データを視覚化し、あるいは容易に解析できる研究基盤を構築し、バイオインフォマティクスの専門家でなくても大きな負担なしにデータ解析が可能なプラットフォームを構築している。本発表ではその概要を示し、今後の見通しについて議論する。
番 号 47
タイトル 解析ワークフローとデータベースの連携基盤構築
発表者 福井一彦1)2)、田代俊行1)、矢葺幸光1)、浅井潔1)
所 属 1)産業技術総合研究所 生命情報工学研究センター  2)産業技術総合研究所 創薬分子プロファイリング研究センター
要 旨 ライフサイエンス分野では様々な解析ツールやソフトウェアが存在しており、効率よく解析するにはその使い易さに加え、大規模データからの知識抽出のためデータベースとの連携が必要です。我々は解析ツールの統合化として、ユーザが処理の組み合わせを指定することが可能であり、使いやすさを考慮した柔軟性、操作性に優れたプラットフォーム上で動作するワークフローの構築を行っています。この解析プラットフォームを用い、ノード化された解析ツールのプログラム群とデータベース(トリプルストア)を接続し、シームレスに連携した解析ワークフローを構築することが可能です。またデータベースのRDF化に伴い、開発した高度な解析ツール群を広く利用可能とするために、セマンティック技術に対応したSADI(Semantic Automated Discovery and Integration)フレームワークを利用して、解析ツールにRDF入出力機能を追加し、データベースと組み合わせた大規模解析を可能とする解析サービスやツール群のオントロジー開発を行っています。
番 号 48
タイトル ゲノムネットにおけるデータ統合と新規分野データ開発のための基盤技術開発
発表者 時松敏明、小寺正明、守屋勇樹、中川善一、五斗進
所 属 京都大学化学研究所 バイオインフォマティクスセンター
要 旨 近年、メタゲノム・メタメタボロームデータの蓄積が進んできており、これらのデータを有効活用するためのデータベース統合化が必要とされている。これらのデータを有効活用するためには、遺伝子情報と化学情報を統合活用する必要がある。このための鍵情報が代謝反応情報であるが、ゲノムと関連付けて整備された反応データは世界的にも稀であり、データ整備と応用ツールの開発は重要課題の一つである。この問題に対応するため、我々は以下の3点を軸に基盤技術開発を行ってきた。1)データベース間の関連情報であるLinkDBを統合利用環境に応用するための、RDF検索への拡張とデータの継続的な更新。2)メタゲノム・メタメタボロームなどの新規分野データ活用技術開発。3)遺伝子や代謝産物と比べ整備が遅れている生化学反応のオントロジー整備とその検索応用。ここでは、これらの基盤整備及び基盤技術開発の最新状況について紹介する。本プロジェクトで開発したデータベースやツールは、すべてゲノムネット(http://www.genome.jp/ja/)からアクセスできる。
番 号 49
タイトル TogoGenome/TogoStanza: データ統合と再利用性向上のためのゲノム情報デザイン
発表者 片山俊明1)、岡本忍1)、川島秀一1)、藤澤貴智2)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター  2)情報・システム研究機構 国立遺伝学研究所 生命情報研究センター
要 旨 生物種ごとのゲノム配列の位置情報は、データベースで大量のゲノム情報や実験データを集約する基準として機能している。その結果ゲノムデータベースは、多種多様なデータソースを統合するプラットフォームとして利用され、世界中で似たシステムが繰り返し開発されている。そこで、ゲノムデータベースを構成するデータやパーツの再利用性を高め、データベース開発とデータ統合のコストを下げるための技術的枠組みを開発した。
TogoGenomeは、セマンティックWeb技術で統合されたゲノム情報を各専門分野で開発されているオントロジーの階層構造を利用して絞り込み(ファセット検索)可能にしたシステムである。今後、塩基・アミノ酸配列や文字列検索など多様な検索ツールを追加予定である。検索結果は、TogoStanzaシステムにより、「生物種」「遺伝子」といった定型の文脈で可視化される。TogoStanzaは、生物学的意味単位で繰り返し参照される可視化パターンを再利用可能なパーツとして提供する。検索した結果は、解析用のデータセットとしてExcel形式などでダウンロード可能である。
番 号 50
タイトル TogoTable update 2013
発表者 河野信1)、渡辺敦2)、山口敦子1)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター  2)クロスエッジ・システムズ
要 旨 TogoTableは、表形式データに含まれるバイオデータベースのID番号をキーにして、世界各地で提供されているSPARQLエンドポイントからアノテーション情報を取得し、元の表データに追加するウェブサービスである。これまでにUniProtのID番号をキーにしてUniProtのアノテーションデータを取得するシステムをプロトタイプとして開発した。Linked Open Dataの特性を活かすべく検索対象SPARQLエンドポイントを追加し、新たにPDBデータのアノテーション情報を取得可能にした。また、UniProtに記載されているリンク情報を使ってPubMed IDなどさまざまなデータベースのID番号からUniProtのアノテーション情報を取得可能にした。今後はNBDCで提供されているデータベースアーカイブのデータなどさらに検索対象SPARQLエンドポイントを拡充していく予定である。
番 号 51
タイトル 生命科学データに適したトリプルストア調査
発表者 呉紅艶1)、藤原豊史2)、山本泰智1)、山口敦子1)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター  2)株式会社インテック
要 旨 セマンティックウェブ技術を用いたデータベース統合において、RDFデータを格納するトリプルストアを適切に選択することは、検索速度において非常に重要である。昨年度は、生命科学データに適したトリプルストアを選択するために、Cell cycle ontology、Allie、PDBj、UniProt、DDBJのサイズが大きく異なる5つのデータセットに対し、OWLIM-SE、Virtuoso、4store、Bigdata、Mulgaraの5種のトリプルストアのロード時間、クエリ応答時間の測定などを行った。今年度はVirtuoso 7 が発表され、昨年度の調査でよい成績を収めた Virtuoso6と比べ様々な面での機能向上が期待されることを踏まえ、Allie、PDBjの二つのデータセットについて、ロード時間、クエリ応答時間について性能比較を行った。本発表ではその性能比較調査結果を中心に、今年度得られたトリプルストア調査結果について述べる。
番 号 52
タイトル セマンティックウェブ技術を用いた生命科学系データベースアーカイブのデータ統合
発表者 山口敦子1)、大久保克彦2)、呉紅艶1)、櫛田達矢2)、畠中秀樹2)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター  2)科学技術振興機構 バイオサイエンスデータベースセンター
要 旨 生命科学系データベースアーカイブは、バイオサイエンスデータベースセンターが運用しているサービスであり、国内のライフサイエンス研究者が生み出したデータセットをわが国の公共財としてまとめて長期間安定に維持保管し、メタデータを統一して検索を容易にすると共に、利用許諾条件などの明示を行うことで、多くの人が容易にデータへアクセスしダウンロードを行えるようにするものである。このアーカイブには2013年7月現在、61のデータベースが含まれている。それらのデータベースについて、データを統合し、より価値の高い利用を可能とするために、セマンティックウェブ技術を用いることを試みる。特に、ユースケースをいくつか仮定し、それに沿った検索を実現するために、各データベースに含まれるデータのRDF化に加え、生物種や化合物など、一部のデータについてはアーカイブ内で標準となる記述方法を与え、それに沿ってデータを書き加える、リテラルで与えられたIDをURIで表現し、それを書き加える、必要に応じてオントロジーを付与するなどの作業を行い、データ統合へ向けた実効性や問題点を調査検討する。
番 号 53
タイトル バイオサイエンスデータベース統合に向けて ~NBDC実務者連絡会の活動のこれまでと今後~
発表者 櫛田達矢、畠中秀樹
所 属 科学技術振興機構 バイオサイエンスデータベースセンター
要 旨 バイオサイエンスデータベースセンター(NBDC)はライフサイエンスデータベース統合推進事業として基盤技術開発(1課題)および統合化推進(11課題)の2種類のプログラムを実施し、データ統合に必要な技術開発および分野別のデータベース統合を推し進めている。NBDC実務者連絡会は、これら各課題の研究開発が円滑かつ効率的に進展することを目的として設置され、主にNBDC実務者連絡会wikiページ(http://wg.biosciencedbc.jp/)やメーリングリストを通して、データベース統合に関係する情報の共有や技術の活用を進めるとともに、各課題の実務者連絡会担当者を対象とした全体会議を開催し、基盤技術開発プログラムの成果であるオントロジー構築支援ツールOntoFinder/OntoFactoryの使用方法の説明やデータベースキュレーションのノウハウなどの提供に努めてきた。今後は、NBDCおよびライフサイエンス統合データベースセンター(DBCLS)がオーガナイズするBioHackathon(http://www.biohackathon.org/)で国際的に取り組んでいるバイオサイエンスデータの標準化と相互運用性に関係する研究開発の成果についても、国内のバイオサイエンスデータベースの提供者、構築者を対象に幅広くかつ、わかりやすく紹介し、データベース統合の促進と発展に貢献したいと考えている。
番 号 54
タイトル テキスト処理技術を用いたキュレーション支援
発表者 山本泰智1)、岡本忍1)、宮沢せいは2)、市川夏子2)、藤田信之2)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター  2)製品評価技術基盤機構 バイオテクノロジーセンター
要 旨 昨今のシーケンス技術の発展により膨大な量のゲノム配列データが生産されている。科学者はINSDに当該ゲノム配列を登録するだけでなく、各遺伝子について注釈作業を網羅的に行う必要がある。その中でタンパク質の定義(デフィニション)を割り当てることは主要な部分であり、そして高速化が困難な部分でもある。特に、統制語彙を用いて網羅的に遺伝子に注釈付けすることは困難を伴う。そこでゲノム配列のデータベースへの高速な登録や、より効率的に質の良い注釈作業を行える効果的な注釈システムの開発が急務である。
我々は自然言語処理関連技術を利用し、上記問題を生じさせる主原因の一つであるデフィニションの表記上の揺れを吸収する正規化を行っている。表記揺れの生じるパターンが幾つかあるが、その中で特に遺伝子名やタンパク質名の同義語といった複雑なものについては生物種や注釈全体の一貫性を考慮する必要がある。注釈付けを行うアノテーターは通常、デフィニションの書き換え作業を行うに当たり明確なルールとともに暗黙のルールを構築しているため、我々はこれらのルールの適用を計算機で可能とするための作業を進めている。得られた成果と課題を報告する。
番 号 55
タイトル 論文の引用情報検索システムColil
発表者 山本泰智1)藤原豊史2)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター 2)株式会社インテック
要 旨 自身の論文中で他の論文を引用する際には、自身の主張の基になる事実が書かれていたり、類似の主張がなされているなど、当該論文と自身の論文との関係を明確にする必要がある。しかし、特に英語を母国語としない研究者が英語でこのような関係を説明しようとする際には的確な書き方がなかなか思いつかないこともあると考えられる。そこで、これから引用しようとする論文が既に他の論文から引用されているならば、そこに実際に書かれている記述を見ることで執筆作業がより効率的になると考えられる。
このような背景を踏まえ、ある論文を引用している論文中での、引用に関する記述(文脈)を簡単に検索できるサービスとして Colil(Comments on Literature in Literature, http://colil.dbcls.jp/)を開発した。本サービスは機械可読な形での論文全文の再配布が可能なライセンスで提供されているPMC Open Access Subset (約60万件)を利用して構築している。また、Colilのデータは全てRDFで表現され、SPARQLを用いた問合せに対応可能である。
番 号 56
タイトル 新しい日本語Webコンテンツ、「新着論文レビュー」と「領域融合レビュー」
発表者 飯田 啓介
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨 ライフサイエンス統合データベースセンターは、日本語Webコンテンツとして、「ライフサイエンス 新着論文レビュー」および「ライフサイエンス領域融合レビュー」を公開している。「新着論文レビュー」は、トップジャーナルに掲載された日本人を著者とする生命科学分野の論文について、論文の著者自身の執筆による日本語のレビューを、だれでも自由に閲覧・利用できるよう、いち早く公開するもので、すでに500本以上が公開されている。「領域融合レビュー」は、生命科学において注目される分野・学問領域における最新の研究成果について、第一線の研究者の執筆による日本語のレビューを、だれでも自由に閲覧・利用できるよう、無料で公開するもので、すでに15本以上が公開されている。ともに、広く生命科学全般にかかわる教員・研究者および大学院生・学生を対象とし、とくに読者として生命科学において専門分野の異なる人を意識している。よりわかりやすいものとするため、用字・用語の統一にくわえ、生命科学専門の編集者の視点から一文一文を吟味して大胆な修正を行っている。公開されたレビューはクレジットの明記を条件に、自由に転載・改変・再利用を行える。