ポスター発表


ポスター発表は14:10 ~ 15:50を予定しております。
説明は14:15~15:00がポスター番号奇数、15:00~15:45がポスター番号偶数とします。
発表者はこちら(ポスター様式、ポスター設置・撤去などのタイムスケジュール等)をご覧ください。

※ポスター発表の内容の関係性を表わした図はこちらからご覧いただけます。

 

※ポスターや発表スライド等の著作権は、別途記載がない限り発表者・発表者の所属機関に帰属します。
  ポスター・スライド内の図や文言を転用する際には、著作者と話し合っていただくようお願いいたします。

ポスター
番号

代表発表者 所属 タイトル 発表
資料
1 坂東明日佳 科学技術振興機構 バイオサイエンスデータベースセンター 生命科学系データベースのカタログ及びアーカイブの省間連携 pdf
2 ソロビヨワ イェレナ 農業生物資源研究所 農業生物先端ゲノム研究センター 画期的な農畜産物作出のためのゲノム情報データベースの整備 pdf
3 坂手龍一 医薬基盤研究所 難病・疾患資源研究部 難病資源研究室 (独)医薬基盤研究所の公開データベース pdf
4 間宮健太郎 産業技術総合研究所 バイオメディシナル情報研究センター 経済産業省ライフサイエンスデータベースプロジェクト・ポータルサイトMEDALSの新たな展開 pdf
5 竹村清 医薬基盤研究所 難病・疾患資源研究部 政策・倫理研究室

ヒト由来研究資源の政策・倫理・権利問題について

pdf
6 箕輪真理 科学技術振興機構 バイオサイエンスデータベースセンター

ヒトデータ共有に向けた体制整備について

pdf
7

三橋信孝

科学技術振興機構 バイオサイエンスデータベースセンター ヒト脳疾患画像統合データベース構築におけるJ-ADNI の取り組み pdf
8 岡田直大 東京大学大学院医学系研究科精神医学分野

精神疾患の病態解明に向けたMRI脳画像データベースの構築と研究支援

pdf
9 川口喬久 京都大学医学研究科 附属ゲノム医学センター 疾患ゲノム疫学解析分野

大規模ゲノム疫学研究の統合情報基盤の構築

pdf
10

小池麻子

日立製作所中央研究所

データ統合化推進プログラムにおけるヒトゲノムバリエーションデータベース

11 長井陽子 産業技術総合研究所 バイオメディシナル情報研究センター 分子システム情報統合チーム

RAvariome:関節リウマチ感受性ゲノム多型データベースと遺伝的リスク予測ツール

pdf
12 鈴木穣 東京大学大学院新領域創成科学研究科

DBTSS: 転写開始点および転写制御因子データベース

pdf
13 五十嵐芳暢 医薬基盤研究所 創薬基盤研究部 トキシコゲノミクス・インフォマティクスプロジェクト

Open TG-GATEsのRDF化によるデータ統合

14

米納朋子
神谷知美
池内志帆

京都大学化学研究所

KEGG MEDICUS感染症リソースとお薬手帳

pdf
15 荒武 かずさDNA研究所

Metabolonote:メタボロームデータの連携と高度利用を目指したWikiベースのメタデータ管理システムの構築

pdf
16 金谷重彦
小野直亮
奈良先端科学技術大学院大学 情報科学研究科 計算システムズ生物学研究室

KNApSAcKファミリデータベース:メタボロミクスから展開する植物の多目的活用に向けて

17

市原寿子

かずさDNA研究所

ゲノム情報に基づく植物データベースの統合

pdf
18 中谷明弘 新潟大学研究推進機構

遺伝子オルソログDBの構築とそれに基づく植物ゲノムDBの統合

pdf
19 黒川顕 東京工業大学

微生物統合データベース MicrobeDB.jp

pdf
20 内山郁夫 基礎生物学研究所

微生物比較ゲノムデータベースMBGDの改良

pdf
21 藤澤貴智 国立遺伝学研究所

微生物ゲノムおよびアノテーションリファレンスの知識基盤情報の整備

pdf
22 市川夏子 製品評価技術基盤機構 バイオテクノロジーセンター

微生物の二次代謝産物生合成遺伝子クラスターDB “DoBISCUIT”の構築

pdf
23 森宙史 東京工業大学大学院生命理工学研究科

微生物の生息環境データの記述および高度な検索のためのオントロジー構築

pdf
24 川島秀一 情報・システム研究機構 ライフサイエンス統合データベースセンター

LinkedDataとオントロジーによる生命科学データの高度検索

25 時松敏明 京都大学化学研究所バイオインフォマティクスセンター

ゲノムネットにおける反応オントロジーの整備と応用ツールの開発

pdf
26 金進東 情報・システム研究機構 ライフサイエンス統合データベースセンター

OntoFinder/OntoFactory - 生命科学オントロジー構築支援サービス

pdf
27 櫛田達矢 科学技術振興機構 バイオサイエンスデータベースセンター

NBDC実務者連絡会の役割とその取組

pdf

28

中村保一 国立遺伝学研究所

日本DNAデータバンク (DDBJ)

pdf
29 大田達郎 情報・システム研究機構 ライフサイエンス統合データベースセンター

Sequence Read Archiveにおける公共NGSデータのシーケンスクオリティとメタデータ

pdf
30 仲里猛留 情報・システム研究機構 ライフサイエンス統合データベースセンター

疾患の切り口から公共データベース中のNGSデータを利活用する

pdf
31 小野浩雅 情報・システム研究機構 ライフサイエンス統合データベースセンター

遺伝子発現リファレンスデータセット『RefEx』

pdf
32 坊農秀雅 情報・システム研究機構 ライフサイエンス統合データベースセンター

GEO目次による低酸素刺激前後のトランスクリプトームの種横断的解析

pdf
33 内藤雄樹 情報・システム研究機構 ライフサイエンス統合データベースセンター

統合遺伝子検索GGRNA

pdf
34 中村春木 大阪大学蛋白質研究所

PDBjとwwPDBにおけるデータ統合化の進展

pdf
35 小林直宏 大阪大学蛋白質研究所

仮想化技術による生体高分子NMR解析環境およびBMRBデータベースサーバーの統合化

pdf
36 村上勝彦 産業技術総合研究所

蛋白質複合体データベース:human protein complex database with quality index (PCDq)

37 深田麻衣子 農業生物資源研究所

植物の比較ゲノム解析データベース-SALAD database-進化上保存されたアミノ酸モチーフの統合に向けて-

pdf
38 陳怡安 医薬基盤研究所 創薬基盤研究部 バイオインフォマティクスプロジェクト

TargetMine, a data warehouse system for target discovery

39 鹿内俊秀 産業技術総合研究所 糖鎖医工学研究センター

日本糖鎖科学コンソーシアム・データベース(JCGGDB)

40 加藤雅樹 理化学研究所 基幹研究所 システム糖鎖生物学研究グループ 糖鎖構造生物学研究チーム

理研糖鎖コンフォメーションデータベース

41 山田一作 野口研究所 糖鎖有機

グライコナビ:化学構造式検索

pdf
42 土井考爾 理化学研究所 生命情報基盤研究部門

BioLOD:フェノームおよびバイオリソース情報の統合と共有

pdf
43 大浪修一 理化学研究所 生命システム研究センター発生動態研究チーム

生命動態システム科学のデータベースの統合化

pdf
44

山口敦子

情報・システム研究機構 ライフサイエンス統合データベースセンター

NBDC/DBCLS BioHackathon 2012 報告

pdf
45 呉紅艶 情報・システム研究機構 ライフサイエンス統合データベースセンター

生命科学データに適したトリプルストア調査

pdf
46 岡本忍 情報・システム研究機構 ライフサイエンス統合データベースセンター

情報統合化・知識発見のためのキュレーション支援

47 今西規 産業技術総合研究所 バイオメディシナル情報研究センター

世界のバイオデータベースの統合化をめざしたリンク自動管理システム

48 大波純一 科学技術振興機構 バイオサイエンスデータベースセンター

NBDCが公開するデータベース横断検索サービスの現状

pdf
49 伊藤真和吏 医薬基盤研究所 創薬基盤研究部 バイオインフォマティクスプロジェクト

創薬・疾患研究のための生命科学分野のデータベース一括横断検索 Sagace

pdf
50 河野信 情報・システム研究機構 ライフサイエンス統合データベースセンター

TogoTable: RDF技術を利用したテーブル形式データへの自動アノテーション付加ツール

pdf
51 片山俊明 情報・システム研究機構 ライフサイエンス統合データベースセンター

RDFゲノム:セマンティックウェブによるリファレンスとしてのゲノム知識基盤の開発

pdf
52 福井一彦 産業技術総合研究所 生命情報工学研究センター

解析プラットフォームによる統合利用環境の構築

pdf
53 大久保公策 情報・システム研究機構 ライフサイエンス統合データベースセンター

BodyParts3D/Anatomography

pdf
54 飯田啓介 情報・システム研究機構 ライフサイエンス統合データベースセンター

新たな日本語Webコンテンツ「ライフサイエンス 領域融合レビュー」

pdf

 

 

発表者の皆さまへ


1.タイムスケジュール

  貼 付 : 9:30   ~ 10:30
  掲 示 : 10:30 ~ 15:50
  説 明 : 14:15 ~ 15:45 
  (ポスター番号奇数 14:15~15:00、ポスター番号偶数15:00~15:45)

  撤 去 : 15:45 ~ 15:50

2.掲示場所

  時事通信ホール受付前 ギャラリー
  (パネル左上隅にポスター番号が貼ってありますので、所定のパネルに貼付ください。)

3.掲示スペース

  パネルサイズはW900mm×H2,100mmです。A0サイズのポスターが丁度よいサイズです。

4.説明時間

  ポスター番号奇数の方は14:15~15:00
  ポスター番号偶数の方は15:00~15:45
  該当する時間にポスターの説明をお願いいたします。

5.ポスター撤去

  ポスターはポスター発表終了後15:45~15:50の間に撤去してください。
  15:50以降に掲示されているポスターについては事務局で撤去いたしますので、
  あらかじめご了承ください。

6.デモ(ネットワーク・電源の使用)について

  ポスター発表の会場には電源のご用意がありませんのでご注意ください。
  デモ用にネットワーク使用をお申し出いただいた発表者には、
  当日事務局より詳細をご連絡いたします。
  (※一般参加者用のネットワークのご用意はございません)

7.その他

  ポスター上部には、タイトル・発表者及び所属を記してください。
  代表発表者の氏名の前に○印を付けてください。
  ポスター掲示に必要な押しピンは事務局で用意いたします。
  ご不明点やご質問等ありましたら、事務局までお問い合わせください。

 

 

ポスター発表詳細(ポスター情報)


番  号 : 1

タイトル : 生命科学系データベースのカタログ及びアーカイブの省間連携

発 表 者:坂東明日佳1),熊谷禎洋2),大久保克彦2),八塚茂2),畠中秀樹1)

所  属 : 1)科学技術振興機構 バイオサイエンスデータベースセンター,
          2)
株式会社日立ソリューションズ

要  旨 :
バイオサイエンスデータベースセンターでは内閣府主導のもと文部科学省・農林水産省・厚生労働省・経済産業省の生命科学系データベースのカタログ、横断検索、アーカイブの省間連携を進めている。データベースの所在情報と様々な属性をまとめたリストを作成するカタログ連携では、各省が持つ情報の集約、記述規則の策定及び記載内容の統合を行い4省にまたがるカタログ「Integbioデータベースカタログ」β版を昨年公開した。国内で約800件、国外も含め約1,200件のデータベースを既に記載している。さらに今秋に公開予定の正規公開版サイトではデータの対象 (DNA、蛋白質など)やデータの種類 (配列、構造など)を示すタグで目的のデータベースを絞り込める機能を提供する。一方、データを丸ごとダウンロード可能にするアーカイブでは各省でのアーカイブ作成の支援を進め、「Open TG-GATEs」「GDBS」「DGBY」など連携の成果を蓄積しつつある。今後も各省でのデータベースの情報収集やアーカイブ化に協力するとともに、昨年12月に公開した省間連携のポータルサイトintegbio.jpなどを通じて成果の活用の促進も進めていきたい。

 

番  号 : 2

タイトル : 画期的な農畜産物作出のためのゲノム情報データベースの整備

発 表 者:ソロビヨワ イェレナ1),春原嘉弘2),長村吉晃1),伊藤剛1),宮尾安藝雄1)

所  属 : 1)農業生物資源研究所 農業生物先端ゲノム研究センター,
          2)
農業・食品産業技術総合研究機構 作物研究所 稲研究領域

要  旨 :
これまでの農畜産物に関するゲノム解析のプロジェクトで、イネのゲノム塩基配列をはじめ多くのゲノム解析情報が得られ、様々なデータベースが作られてきた。これらの情報は、新たな作物や家畜の作出を効率的に進める上で、非常に有用な資産となっている。一方、次世代型シーケンサーの出現により、これまでとはけた違いの大量のゲノムデータが得られ、その規模に見合った新たな解析手法の開発、および、データの永続的な維持管理が課題となっている。これらのデータからより詳細なDNAマーカーを抽出し、農業上有用な形質遺伝子の同定や、マーカーを用いたターゲット遺伝子の効率的な導入技術の開発が期待されている。昨年度より開始された本プロジェクトは、機器の更新をしてデータベースの移行が完了したところである。システムは大量の塩基配列解析に対応するため、100台の解析用クラスタ、高速記憶装置、2TBの大容量メモリサーバ、2PBの大容量記憶装置、20台のWebサーバから構成されている。従来からのデータを継承しつつ、大量の塩基配列データに対応したデータベースシステムの開発を進めている。今回はそのシステムの概要と進捗状況について報告する。

 

番  号 : 3

タイトル : (独)医薬基盤研究所の公開データベース

発 表 者:坂手龍一1),坂口由希2),竹村清2),高橋一朗1),増井徹1)

所  属 : 1)医薬基盤研究所 難病・疾患資源研究部 難病資源研究室,
          2)
医薬基盤研究所 難病・疾患資源研究部 政策・倫理研究室

要  旨 :
厚生労働省の研究機関である独立行政法人医薬基盤研究所(基盤研)は、創薬支援を目的としたデータベース群を公開している。(1)難病の治療研究を推進するための公的バンクである難病研究資源バンク(http://raredis.nibio.go.jp/)の試料データベースは、14疾患の患者さんから提供された500例以上の分譲試料(DNAや血清など)データを公開している。(2)生物資源の所在情報共有と流通促進を目的とするメディカルバイオリソースデータベース(http://mbrdb.nibio.go.jp/)は、ヒトと実験動物の疾患資源データを300件以上公開している。(3)基盤研のデータベース統合化の試みとして昨年公開された横断検索システム(http://alldbs.nibio.go.jp/)では、トキシコゲノミクスデータベース(Open TG-GATEs)や疾患ゲノムデータベース(GeMDBJ)などの8データベースの合計20万件以上のデータを検索対象としており、今年度は、難病研究資源バンクと希少疾病治験ウェブ(http://www.nibio.go.jp/orphan/)を追加予定である。基盤研の公開データベースは、4省間データベース横断検索を提供するSagace(http://sagace.nibio.go.jp/)と連携し、データの利用促進を図っている。

 

番  号 : 4

タイトル : 経済産業省ライフサイエンスデータベースプロジェクト・ポータルサイト
       MEDALSの新たな展開

発 表 者:村上勝彦,間宮健太郎,山崎千里,原雄一郎

所  属 : 産業技術総合研究所 バイオメディシナル情報研究センター

要  旨 :
経済産業省ライフサイエンスデータベースプロジェクトは、経済産業省関連の研究成果物等の整備・統合を進めるプロジェクトである。経済産業省関係で開発されたバイオ・データベース(DB)の情報を収集し、ポータルサイトMEDALS(METI Database portal for Life Science)で公開している。継続的に便覧の追加・更新を行った結果、DB・解析ソフトの登録数は150個を超え、経済産業省関連の成果物を網羅的に情報提供している。MEDALSの主な内容は、DBと解析ソフト・プロジェクトなどの便覧、アーカイブ、MEDALS横断検索、およびMEDALSツールである。新機能としては、便覧に登録しているDBの属性(例えば、生物種と分子種)を軸にして分類表示できる「DB分類」がある。MEDALS横断検索は、文部科学省、農林水産省、厚生労働省関連のデータベースポータルと連携しており、日本語と英語で検索ができる。MEDALSツールでは、利用者が興味をもっている遺伝子やタンパク質などについて、世界の主要DBで新たにリリースされたデータの情報をお知らせする「BioDB Scan」を公開した。

 

番  号 : 5

タイトル : ヒト由来研究資源の政策・倫理・権利問題について

発 表 者:竹村清1),坂口由希1),岩江壮介1),坂手龍一2),増井徹1)

所  属 : 1)医薬基盤研究所 難病・疾患資源研究部 政策・倫理研究室,
          2)
医薬基盤研究所 難病・疾患資源研究部 難病資源研究室

要  旨 :
ヒトの生物学としての医学研究の発展の中で、人体に由来する試料と情報を利用することにより、統合体としての人の研究が可能となった。そのような中で、もともとはある個人に由来する試料と情報が、その人とは全く関係のない人たちの手の中で「使用」されていくという過程が生じている。そして、それを効率化するために、データベース化という作業が行なわれ、試料と情報は、その由来する個人との関係を絶たれていくことになる。
このような状況の中で、私の体は誰のもの、私の生から生まれた情報は誰のものかという素朴な疑問が生まれる。
有名なムーア事件、また、最近のカタロナ事件など、個人の提供或いは寄贈した生体試料の所有権の問題は、米国の裁判所での判決が確定している。しかし、日本においては、そのような事例は、自治医大における病理標本の返還訴訟の他に無く、それも大変に偏った判断が示されただけであるとされている。
実際には、ヒトの試料と情報が研究に使用される場合には、それらの提供者に対する説明と同意のプロセスを経て、かつ匿名化という手続きを経て使用される。ヒトゲノム研究指針の改正の動きなどを見ながら、ヒト由来の試料と情報と、その提供者との関係について論考する。

 

番  号 : 6

タイトル : ヒトデータ共有に向けた体制整備について

発 表 者:箕輪真理,三橋信孝

所  属 : 科学技術振興機構 バイオサイエンスデータベースセンター

要  旨 :
バイオサイエンスデータベースセンター(NBDC)ではデータの共有に向けた様々な取り組みを行っているが、中でもヒトを対象とした研究データは共有に対する研究者の期待が高く、早急に共有の体制を整えることが必要である。一口にヒトデータとは言っても、いわゆる個人情報に直結するものから、機微な情報を伴わない科学的なデータとすべきものもあり、どのようなデータをどのような方針で公開するのか、利用者が守るべきルールは何かを明確にしないことには、データを提供する側(試料提供者および研究者)の協力を得ることは難しい。加えて、国内では様々なヒトデータを収集するプロジェクトが先行しており、そこで理解されている安全なデータの取扱いとの整合性も必要である。NBDCではこのような状況を踏まえ、データ提供者によって考え方の異なるセキュリティレベルを2段階に整理し、データの分類や手続きを明確化して、国内での共通ルールとなりうる基本ガイドラインの設計を試みた。一方、ヒトデータの多様性に対応するために共有データセットの範囲や扱いは提供者と協議して決定することとし、ゲノムデータに関する国内ガイドラインの改訂や一般的な理解の変化に柔軟に対応できるガイドラインを目指している。

 

番  号 : 7

タイトル : ヒト脳疾患画像統合データベース構築におけるJ-ADNI の取り組み

発 表 者:三橋信孝1),千田哲子2),鶴瀬和彦3),槇野正2),上野正孝2),岩坪威4)

所  属 : 1)科学技術振興機構 バイオサイエンスデータベースセンター,
          2)
バイオテクノロジー開発技術研究組合,
        3)日鉄日立システムエンジニアリング,4)東京大学大学院医学系研究科

要  旨 :
我々は「精神疾患の病態解明に向けたMRI脳画像データベース(包括型脳科学研究推進支援ネットワークDB)」と連携し、両者のデータを統合したヒト脳疾患画像統合データベースの構築を進めている。本発表ではDB構築に向けたJ-ADNI(Japanese Alzheimer’s Disease Neuroimaging Initiative)の活動を紹介する。
全国38か所のJ-ADNI臨床施設から提供される、健常高齢者(154人)、軽度認知障害(239人)、軽症アルツハイマー病(150人)の脳画像(MRI、PET)、臨床情報、遺伝情報、体液生化学情報を2~3年間収集した。品質管理ならびに機器ごとに異なる画像の歪みやむらの補正を行いながら、一元管理のためのローカルデータベースの構築を行っている。ベースライン時点については目標の90%以上の検体の収集を完了した。ベースライン以降のデータの収集も進んでおり、各種データがそれぞれ1,000件以上蓄積されている。米国ADNIとの互換性を意識しながら、補正や品質管理方法などのメタデータもデータベース化し、ユーザが安心して再利用できるデータベースを目指している。さらに、脳画像特有の問題として、断面画像を3次元再構成して個人識別できる可能性が否定できないため、その取り扱いについても検討している。

 

番  号 : 8

タイトル : 精神疾患の病態解明に向けたMRI脳画像データベースの構築と研究支援

発 表 者:笠井清登,岡田直大,八幡憲明,西村幸香

所  属 : 東京大学大学院医学系研究科 精神医学分野

要  旨 :
精神疾患の病態研究では、分子・細胞・動物モデル・神経画像などのモダリティで様々な知見が蓄積されてきた。今後、その病因・病態に関わる要因の同定や、仮説検証の試みを一層加速させるためには、MRI脳画像のような研究リソースを従来以上に充実させ、これを包括的に利用しながら研究を進めることが重要と思われる。ただし、個別のグループが一定の研究目的に従い、短期間でリソースを多数取得することは容易でない。また、病態解明に真のブレークスルーをもたらすためには、データ解析や統計理論に熟知した専門家、最新の分子生物学的解析法に精通する基礎神経科学者との連携も不可欠である。
我々は、包括型脳科学研究推進支援ネットワークの疾患拠点として、精神疾患のMRI脳画像と付随する臨床情報を多数例収載したデータベースの構築を進めている。また、MRI画像の収集・管理・解析についてもプロトコルの標準化を図り、研究者コミュニティに対して普及活動と運用支援を行っている。このような活動を契機に、精神疾患に関連する新規バイオマーカーの発見や新規治療法の開発が促進されるよう、長期的な視点に立って研究基盤の整備に取り組んでいる。

 

番  号 : 9

タイトル : 大規模ゲノム疫学研究の統合情報基盤の構築

発 表 者:川口喬久1),佐藤孝明2),山田亮3),松田文彦1)

所  属 : 1)京都大学医学研究科 附属ゲノム医学センター 疾患ゲノム疫学解析分野,
          2)
株式会社島津製作所 基盤技術研究所 ライフサイエンス研究所,
        3)京都大学医学研究科 附属ゲノム医学センター 統計遺伝学分野

要  旨 :
ゲノム疫学研究は、疾患を含む種々の形質と、遺伝因子や環境因子などの多様な因子との関連や因果関係、さらに、それらの相互作用を明らかにすることが目的である。そのためには、被験者から長期にわたって遺伝型や表現型およびその中間形質や環境曝露情報を、解析に適した形で正確に収集し、適正な方法で迅速に解析しなければならない。ここで重要となるのが、匿名化により被験者のプライバシーを守りつつ、臨床情報等との連結を可能とする個人情報管理の枠組みであり、得られた医学的知見の再現性の検証や新たな医学的知見の発見を可能とするための、各項目の標準化や関連付けである。本研究の目的は、その基盤を構築・確立し、それらを、得られた医学的知見とともに広く公開することにある。本年度は「ながはま0次コホート事業」および、臨床研究を含む複数の疫学研究をモデルに、1)被験者の統合を可能にする個人情報管理と匿名化、2)項目の標準化や関連付けを可能にするメタデータ管理、3)それらに基づく追跡調査の効率的な実施、4)データの事後的なキュレーションの支援、5)ユーザの権限に応じたアクセス制御、6)オミックス解析のパイプライン化、の仕組みを中心に構築を進めている。

 

番  号 : 10

タイトル : データ統合化推進プログラムにおけるヒトゲノムバリエーションデータベース

発 表 者:小池麻子1),西田奈央2),吉田真希子1),川嶋実苗2),井ノ上逸朗3),辻省次4)
       徳永勝士2)

所  属 : 1)日立製作所中央研究所,2)東京大学大学院医学系研究科,
        3)国立遺伝学研究所,4)東京大学医学部附属病院

要  旨 :
近年の高速大容量のSNPタイピング技術と超並列シークエンシング技術の急速な発展により、ゲノム全域を対象とした疾患関連多型・変異探索が可能となり、多くの疾患関連遺伝子が発見されつつある。我々のグループでは国内/アジアにおけるこれらのデータの散逸を防ぎ研究者間でデータ共有化するために、2007年よりGWAS-DB、CNV-DBを、 2011年度よりHuman variation DB、HLA-DBを構築し(https://gwas.biosciencedbc.jp/)、データのサブミッションを広く呼びかけるとともにデータの預け入れと再配布の運用を行っている。本DBにおいては、1000人ゲノム等を含む健常者データから構築した日本人のコンセンサス配列を参照ゲノムの1つとして登録している。これらのDBにおいてはGWASのデータ、健常者や患者のSNV(一塩基変異)のみならず長配列の挿入/欠失、構造多型まで収集対象とするとともに、文献中の疾患情報も収集対象とし、日本人/アジア人の変異と表現型(疾患、薬剤応答、ウィルス耐性)との関係の体系化を目指している。

 

番  号 : 11

タイトル : RAvariome:関節リウマチ感受性ゲノム多型データベースと
       遺伝的リスク予測ツール

発 表 者:長井陽子,今西規

所  属 : 産業技術総合研究所 バイオメディシナル情報研究センター
        分子システム情報統合チーム

要  旨 :
生活習慣病などの多因子性疾患に関して、近年、大規模なゲノムワイド関連解析(GWAS)によって多くの疾患感受性ゲノム多型が同定されるようになった。しかしながら、再現性がとれない偽陽性のものや、人類集団間で疾患への影響度が異なるゲノム多型が多く存在することも明らかとなり、研究結果の客観的な比較検討が求められている。そこで我々は、GWASが数多く実施されている関節リウマチ(RA)に注目し、人類集団ごとに、大規模な研究において統計的に有意であったゲノム多型に関して再現性の評価を行い、複数の人類集団や特定の人類集団で再現性が認められるゲノム多型を同定した。特定の人類集団において再現性が確認された84個のゲノム多型の中には、最新の研究で再現性が認められたものだけでなく、これまでのレビュー論文や再現実験で見落とされていたものが含まれていた。本研究成果より得られた疾患感受性ゲノム多型のエビデンス情報を創薬研究や個別化ヘルスケアに応用してゆくため、RA感受性ゲノム多型データベースRAvariomeを公開した。また、本サイトでは信頼性の高いRA感受性ゲノム多型に基づき遺伝的リスクを予測するツールも提供している。RAvariomeはhttp://hinv.jp/hinv/rav/よりアクセスできる。

 

番  号 : 12

タイトル : DBTSS:転写開始点および転写制御因子データベース

発 表 者:鈴木穣1),山下理宇2),菅野純夫1),中井謙太3)

所  属 : 1)東京大学大学院新領域創成科学研究科,2)東北大学 東北メガバンク,3)東京大学医科学研究所

要  旨 :
我々の研究室ではTSS Seq法を用いた転写開始点データを蓄積し、データベースとして公開している(DBTSS; http://dbtss.hgc.jp/)。現在までに、ヒトを中心に30種類の組織、細胞種について、総計5億の転写開始点データを収集、公開しているが、今回、これに近年急速に蓄積している日本人集団でのSNV(1塩基置換ゲノム多型)データを追加した。1000人ゲノム計画あるいは独自に収集したゲノム配列解析結果から得られた約200人分の日本人多型データをもとに、特に転写開始点近傍に位置するSNVについて、その位置を公開している。特に、これまでに疾患との関連の示唆されている遺伝子近傍に位置するものについては、その疾患情報をもとに検索可能である検索機能を実装した。また、他方こちらも急速に蓄積しつつあるChIP Seqデータについても統合的解析を可能とすべくデータの統合を行った。現在、転写開始点近傍での、抑制性、活性性のヒストン修飾、あるいはRNA polymerase等の転写因子結合部位について同様に検索が可能である。我々は様々な転写制御因子の統合的解析によって初めてゲノム中に存在するSNVの生物学的意義の解析が可能になると考えている。

 

番  号 : 13

タイトル : Open TG-GATEsのRDF化によるデータ統合

発 表 者:五十嵐芳暢1),Johan T. Nystrom-Persson2),森田瑞樹2), 3),伊藤真和吏2)
       山田弘1),水口賢司1)4)

所  属 : 1)医薬基盤研究所 創薬基盤研究部 トキシコゲノミクス・インフォマティクスプロジェクト,
          2)
医薬基盤研究所 創薬基盤研究部 バイオインフォマティクスプロジェクト,
        3)東京大学 知の構造化センター,4)大阪大学大学院生命機能研究科

要  旨 :
Open TG-GATEs(Toxicogenomics Project-Genomics Assisted Toxicity Evaluation system)は2002年から2011年度までの官民共同トキシコゲノミクスプロジェクトで得られた成果の一般公開版である。このデータベースには170余りの薬剤をラット個体およびラット・ヒト肝細胞に投与した際の遺伝子発現情報、病理所見情報、血液学および生化学情報が収められている。トキシコゲノミクスプロジェクトではこのデータを用いて、各種安全性バイオマーカーの開発を行った。
Open TG-GATEsは幅広い分野の研究に貢献することを目的としている。より多くの研究者に活用してもらうため、我々は外部データベースと統合を進めている。特に、KEGGパスウェイやChEMBL化合物データ等とのデータ統合のため、Open TG-GATEsのRDF化を進めている。同時にWebアプリケーション上で操作することによるアクセシビリティの改善も進めており、両者のデータベースを関連付けたデータやそれらを用いた解析結果をWeb上で一度に得ることが可能になる。

 

番  号 : 14

タイトル : KEGG MEDICUS感染症リソースとお薬手帳

発 表 者:米納朋子,神谷知美,池内志帆,金久實

所  属 : 京都大学 化学研究所

要  旨 :
KEGG MEDICUS (http://www.kegg.jp/kegg/medicus/)は疾患・医薬品・環境物質など社会的ニーズの高いデータを、ゲノム情報を基盤とした生体システム情報として統合したリソースです。研究者コミュニティや医療関係従事者だけでなく、一般の人々にも有用なリソースとして提供することを目指しています。そのためKEGG DISEASE/DRUGデータベースの開発とともに、他の様々なデータベースとの統合化を進めています。本発表ではとくに感染症に焦点をあて、病原体ゲノムのメタデータ、パスウェイ情報、疾患分類・医薬品分類情報、医薬品添付文書情報、副作用情報などを統合化したリソースの紹介をします。また感染症に限らず、一般の人々が自分の病気や服用している医薬品を入口としてKEGG MEDICUSを利用し、病気の分子メカニズムや医薬品の作用・副作用に対する科学的理解を深めることで、個別化医療、参加型医療、セルフメディケーションといった医療の革新につなぐことを目的としたKEGG MEDICUSお薬手帳の紹介もします。

 

番  号 : 15

タイトル : Metabolonote:メタボロームデータの連携と高度利用を目指した
       Wikiベースのメタデータ管理システムの構築

発 表 者:荒武,榎本光男,有田正規,金谷重彦,櫻井望

所  属 : かずさDNA研究所

要  旨 :
代謝産物の網羅的な分析データ(メタボロームデータ)をデータベースとして公開し、第三者の有効活用をはかるためには、データに付帯する情報、すなわち、分析条件、コンピューター解析条件、人の手による編集・解釈情報などのメタデータを、詳細かつ正確に記述する必要がある。しかし、多くのデータ生産者は、データベースとしての公開を意識せずに研究を進めるため、データの公開にあたっては、メタデータの再回収が最も大きな律速因子の一つとなっている。
そこで我々は、メタボロミクスのメタデータ管理に特化したシステム、Metabolonoteを開発した。Metabolonoteでは、MediaWikiを活用することで、メタデータの記録・編集を簡便にし、データ公開のコスト低減をはかっている。また、実データの管理を行うMassBase(分析生データを公開)、KomicMarket(化合物ピーク同定情報を公開)、Bio-MassBank(MSn情報を公開)などの既存のデータベースから共通して参照可能とすることで、データ統合化に向けたより画一的なメタボローム情報の提供を可能にする。

 

番  号 : 16

タイトル : KNApSAcKファミリデータベース:メタボロミクスから展開する
       植物の多目的活用に向けて

発 表 者:金谷重彦,小野直亮,西岡孝明,中村由紀子,有田正規,櫻井望,荒武,
       森田(平井)晶

所  属 : 奈良先端科学技術大学院大学 情報科学研究科 計算システムズ生物学研究室

要  旨 :
ゲノム生物学とは、対象とする生物の遺伝子の総体(ゲノム)をもとに、種々の環境下で動的に刻々と変化する全遺伝子を対象とした発現プロファイル(トランスクリプトーム)およびタンパク質量(プロテオーム)、さらには、全代謝物の量(メタボローム)を測定し、このような多要素により細胞・組織を特徴づける研究分野である。メタボロミクスが発展した要因の一つに、高分解能の質量分析装置の進展が挙げられる。候補分子式の代謝物を同定するためには、天然物化学により構造決定された二次代謝物のデータベースを構築すること、ならびに広範な代謝物における高次の質量分析情報を予め収集することにより分子式と高次の質量スペクトルから代謝物の予測へとつなぐことが可能となる。この目的を達成することを目的に開発を進めたKNApSAcK Coreデータベース、MassBank、BioMassBankに加え、メタボロームから生物の多目的利用をめざしたオミックスデータベースKNApSAcK Familyについて紹介する。

 

番  号 : 17

タイトル : ゲノム情報に基づく植物データベースの統合

発 表 者:市原寿子1),平川英樹1),中谷明弘2),中村保一1),田畑哲之1)

所  属 : 1)かずさDNA研究所,2)新潟大学研究推進機構

要  旨 :
わが国の植物分子遺伝学、植物ゲノム研究はこれまでに多数の優れた成果をあげており、国際的にも高く評価されてきました。その成果は主に論文として報告され、ゲノム構造・機能、リソースなどの情報がデータベース(以下DB)上で公開されています。しかし、研究対象がモデル植物から農作物まで多種多様であること、提供情報が配列、転写、翻訳、形質など多岐にわたること、研究プロジェクトごとに個別のDBが構築されていることから、異なるプラットフォームをもつ多くのDBが散在しており、利用者にとってわかりにくく、また統一感を欠き国際的なプレゼンスを十分に示せない状態になっています。さらに、DNAマーカーや連鎖地図などの情報は文献上に留まっているものが多く、これらを総合的に検索し必要な情報を入手することは容易ではありません。そこで、我々は次の4項目の研究開発を一体として進めることで、これらの問題の解決をめざしています。
(1)遺伝子オルソログDBの構築とそれに基づく植物ゲノムDBの統合
(2)DNAマーカーおよび連鎖地図情報に基づく植物ゲノムDBの統合
(3)植物リソース情報DBの統合
(4)植物研究に関連する情報基盤の構築

 

番  号 : 18

タイトル : 遺伝子オルソログDBの構築とそれに基づく植物ゲノムDBの統合

発 表 者:中谷明弘1),石井崇洋2),市原寿子2),平川英樹2),中村保一2),田畑哲之2)

所  属 : 1)新潟大学研究推進機構,2)かずさDNA研究所

要  旨 :
オルソログとは、共通の祖先遺伝子から種分岐に伴って派生した遺伝子間の対応関係、もしくは、そのような対応関係にある遺伝子群を指しています。しかしながら、種分岐を遡ってこのような対応関係を実際に確かめることは現実的ではありません。そこで、異なる生物種間でアミノ酸配列が類似している遺伝子同士もオルソログと呼ぶことがあります。オルソログDBは、そのようなアミノ酸配列の類似性に基づいた遺伝子のオルソログ情報を蓄積したデータベースです。オルソログDBが生物種間のハブとしての役割を果たすことによって、様々な生物種のデータベースを互いに結び付けることが可能になります。キーワード検索やアミノ酸配列の類似性検索に基づいてデータをオルソログDBに結び付ければ、データベース内のオルソログ関係を辿ることによって、生物種や系統群を超えたデータの検索の実現が期待できます。現在、オルソログDBは、NCBI RefSeqを中心としたデータベースから取得した緑色植物亜界に属する20生物種の約50万のアミノ酸配列を含んでいます。これら50万のアミノ酸配列のうち約21万で生物種を跨がったオルソログが見い出されています。

 

番  号 : 19

タイトル : 微生物統合データベース MicrobeDB.jp

発 表 者:黒川顕1),中村保一2),内山郁夫3),菅原秀明2)
       MicrobeDB.jpプロジェクトチーム1), 2), 3)

所  属 : 1)東京工業大学,2)国立遺伝学研究所,3)基礎生物学研究所

要  旨 :
数学的基盤が乏しいライフサイエンス研究において、知識の集積体であるデータベース(DB)は、知識の参照のみにとどまるものではなく、新たな研究分野を切り拓く上で欠く事のできない極めて重要な研究基盤である。ライフサイエンス研究の中でも、微生物研究は歴史も古く、これまで蓄積されたデータや知識は膨大かつ多岐にわたっている。さらに、ゲノム科学の発展や新型シーケンサーの普及に伴い、ゲノムやメタゲノムなど圧倒的な量のデータが産出されており、これらを横断的にかつ簡便に利用出来れば、新たな仮説や研究分野の創出がより容易になると期待される。これを実現するため、我々は、ゲノム情報を核として様々な微生物学上の知識を統合し、幅広い分野での微生物学の発展に資することのできる「微生物エンサイクロペディア」の構築を目標として研究開発を行っている。これらデータの統合化は、微生物の体系的な理解を促進し、これまでの仮説検証型の研究のみならず、膨大なデータの中から新たな仮説を導くデータ駆動型の研究を強力に推進する事を可能とする。

 

番  号 : 20

タイトル : 微生物比較ゲノムデータベースMBGDの改良

発 表 者:内山郁夫1),千葉啓和1),西出浩世1),三原基広2)

所  属 : 1)基礎生物学研究所,2)株式会社ダイナコム

要  旨 :
MBGDは、オーソログ関係に基づいて微生物ゲノムの比較解析を行うためのデータベースである。我々は、MBGDのオーソログデータを、大量のゲノムデータを集約して種々の微生物データと統合するための基盤とするために、様々な改良と拡張を進めている。用いるゲノムデータは、従来のRefSeqのみから、GTPS、RefSeq、GenBankのゲノムデータを統合して用いるよう変更した。これから、属あたり1種を代表として選んで作成したものを標準オーソログデータとしているが、さらに多様なゲノムを取り込むために、差分的に標準オーソロググループを拡張する手続きも作成している。オーソロググループ作成の際は、ドメイン単位でオーソロググループを高速に作成するDomClustプログラムを用いているが、その精度を改善するためにマルチプルアライメントを用いた精密化手続きの作成も進めている。一方、多様なゲノムのデータを効果的に活用するため、系統群ごとのオーソログテーブルから、群内で保存された遺伝子を抽出した「コア遺伝子」データの整備も進めており、特に近縁の系統群においては、CoreAlignerプログラムによって、シンテニーの保存に基づいて抽出したゲノムコア構造のデータも保持するように拡張している。

 

番  号 : 21

タイトル : 微生物ゲノムおよびアノテーションリファレンスの知識基盤情報の整備

発 表 者:藤澤貴智1),岡本忍2),片山俊明2),神沼英里1),大柳一1), 3),重元康昌4)
       菅原秀明1),中村保一1)

所  属 : 1)国立遺伝学研究所,
        2)情報・システム研究機構 ライフサイエンス統合データベースセンター,
        3)三菱スペース・ソフトウエア株式会社,4)富士通株式会社

要  旨 :
MicrobeDB.jpプロジェクトにおいて、セマンティックウェブ技術を利用した微生物のデータベースおよびデータの統合化を進めており、我々は、その中でも生物情報を統合する上で重要な基盤となるゲノム情報およびそのリファレンス情報資源の整備に取り組んでいる。これまでにおいて、ゲノムデータベース Gene Trek in Prokaryote Space(GTPS)の更新や菌株保存機関より提供を受けたNBRCのカタログデータのRDF化を実施した。DBCLSと連携してゲノム情報と関連情報のRDFによるモデルの標準化を推進しており、再利用性に配慮した標準的なRDFモデル開発と微生物知識基盤となるデータのRDF化について進捗を報告する。また、TogoAnnotation(http://togo.annotation.jp/)は、ソーシャルブックマークの仕組みによりWebインタフェースを介して柔軟にアノテーションの編集と保存を実現している。コミュニティーゲノムアノテーションプラットフォームとしての環境を整備し、さらにゲノム、遺伝子、文献単位でのデータ再利用性を可能にするAPI開発を行なった。さらにゲノム・メタゲノム解析のためのリファレンスとして重要なモデル微生物の遺伝子関連情報を文献からマニュアルキュレーションにより集積しており、その進捗を報告するとともに、コストのかかる手動アノテーションを加速するための取り組みについても紹介する。

 

番  号 : 22

タイトル : 微生物の二次代謝産物生合成遺伝子クラスターDB “DoBISCUIT”の構築

発 表 者:市川夏子,笹川真稚,小牧久幸,吉田ゆみ,山本美佳,山崎秀司,藤田信之

所  属 : 製品評価技術基盤機構 バイオテクノロジーセンター

要  旨 :
放線菌等の一部の微生物は多様な二次代謝産物を産生することが知られており、その産物は医薬品や農薬として利用されている。一般に二次代謝産物の生合成遺伝子はゲノム上に遺伝子クラスターを形成している。近年、ゲノム解析が比較的手軽になったので、新規二次代謝産物の探索を目的とする微生物のゲノム解析が盛んに行われている。しかし、二次代謝産物の合成経路や合成遺伝子に関する情報は論文で数多く発表される一方で、二次代謝産物の生合成遺伝子クラスターの情報を整備・統合したデータベースは存在しなかった。そのため、解読したゲノム配列中に二次代謝産物の生合成遺伝子クラスターが見つかっても、その新規性の判断は困難であった。
製品評価技術基盤機構(NITE)では有用な生物遺伝資源を提供すると共に、ユーザーが微生物を利用しやすくするために既知の二次代謝産物生合成遺伝子クラスターのデータベースDoBISCUITを構築した。本データベースでは既知の50種類の遺伝子クラスターに関する配列・文献情報を集約し、最新の知見に基づいて専門のアノテーターが遺伝子を機能別に分類・記述している。既知の知見の集積化と包括的比較により得られる効果について紹介する。

 

番  号 : 23

タイトル : 微生物の生息環境データの記述および高度な検索のためのオントロジー構築

発 表 者:森宙史1),岡本忍2),川島秀一2),竹原潤一1),吉野弘二1),山本希1)
       MicrobeDB.jpプロジェクトチーム

所  属 : 1)東京工業大学大学院生命理工学研究科,
          2)
情報・システム研究機構 ライフサイエンス統合データベースセンター

要  旨 :
新型シーケンサーの普及によって環境中の微生物群集をまるごと解析するメタゲノム解析が近年盛んに行われている。メタゲノム解析においては、配列データ以外にも配列データに関連する情報として、様々なメタデータが記述され、公共データベースに登録されている。多種多様なメタデータの中で、特にそのサンプルが取得された環境、つまりは微生物の生息環境に関するメタデータは、メタゲノム解析の結果から生物学的な知見を探索する上で鍵となるデータとなる。しかしながら、公共データベースに登録されているそれらの生息環境に関するメタデータは、用語や記述方法などが統一されていないため、研究者が望んだ検索を行うことが困難な状態になってしまっている。
本研究では、データベース利用者にとって利用しやすいデータベースを構築するための基盤として、微生物の生息環境に関するメタデータを記述し整理するためのオントロジーである、MEO(Metagenome/Microbes Environment Ontology)を構築した。MEOを用いることで、各用語の意味や用語間の関係性が明確になり、絞り込み検索等を行いやすくなると期待出来る。

 

番  号 : 24

タイトル : LinkedDataとオントロジーによる生命科学データの高度検索

発 表 者:川島秀一1),岡本忍1),森宙史2),藤澤貴智3),神沼英理3),中村保一3)
       菅原秀明3),片山俊明1),山本泰智1),市原正巳4),吉野弘二2),竹原潤一2)
       山本希2),黒川顕2)

所  属 : 1)情報・システム研究機構 ライフサイエンス統合データベースセンター,
          2)
東京工業大学大学院生命理工学研究科,3)国立遺伝学研究所,
        4)製品評価技術基盤機構

要  旨 :
ライフサイエンスの基盤的な情報であるゲノムデータでは、文献データ、サンプルを採取した場所、生育環境、実験手法、培養条件など多岐に渡るメタデータが扱われている。これまでも、様々なかたちでメタデータが蓄積されてきたが、計算機による再利用性はかならずしも考慮されていない。Semantic Web技術では、データをLinked Data (RDF)として表現することで、データに様々なメタデータを柔軟に付与することができる。また、メタデータの記述にオントロジーを利用することで計算機での再利用性が高くなる。
そこで我々は、微生物のゲノム・メタゲノム情報に対する高度なデータ検索を実現するために、有用性が高いメタデータのLinked Data化および、オントロジー整備に取り組んでいる。具体的には、生物の生育環境と微生物培養培地のオントロジー構築と、それぞれのLinked Data構築を行なっている。これらの開発状況について紹介したい。

 

番  号 : 25

タイトル : ゲノムネットにおける反応オントロジーの整備と応用ツールの開発

発 表 者:時松敏明,小寺正明,守屋勇樹,中川善一,五斗進

所  属 : 京都大学 化学研究所 バイオインフォマティクスセンター

要  旨 :
メタボロミクス技術の進展により、メタボロームデータ解析に必要な化合物リファレンスデータの重要性が増している。同時に、メタボロームデータと他のオミックスデータとの統合解析に必要となる、代謝反応データの整備も重要となっている。ゲノムと関連付けて整備された反応データは世界的にも稀であり、データ整備と応用ツールの開発はケモバイオインフォマティクスにおける重要課題の一つである。また、リファレンスデータ整備では、リファレンスに含まれない化合物・反応への対応も必要である。
このため、我々は化合物・反応DBの統合化を行うとともに、化合物構造比較ツールを開発してきた。また、化学構造比較のために定義した原子タイプに基づいて、既知代謝反応からの反応パターン抽出法を開発した。抽出したパターンを手動で整理・分類し、反応パターンのデータベースRCLASSと反応オントロジーを構築した。さらに、構築した反応オントロジーを応用して、新規反応経路や類似反応経路の検索・予測ツールを開発している。本プロジェクトで開発したデータベースやツールは、すべてゲノムネット(http://www.genome.jp/ja/)からアクセスできる。

 

番  号 : 26

タイトル : OntoFinder/OntoFactory - 生命科学オントロジー構築支援サービス

発 表 者:金進東,王悦,Simon Kocbek

所  属 : 情報・システム研究機構 ライフサイエンス統合データベースセンター

要  旨 :
オントロジーはデータの効率的な整理、もしくは異なるデータベースの統合的な使用のためその重要性が高まっている。特に生命科学分野ではオントロジーの開発が活発に行われており既存のオントロジーの再利用が最も重要なことになっている。ライフサイエンス統合データベースセンターでは既存のオントロジーに基づいて自分のオントロジーを開発するための一連の過程を支援するため、OntoFinder/OntoFactoryサービスを開発・公開している。生命科学研究者によるオントロジー開発の生産性を高めることにより、オントロジーによるデータベースの統合に繋がることを期待する。

 

番  号 : 27

タイトル : NBDC実務者連絡会の役割とその取組

発 表 者:櫛田達矢1),三橋信孝1),大波純一1),斉藤恭一2),畠中秀樹1)

所  属 : 1)科学技術振興機構 バイオサイエンスデータベースセンター,
          2)
株式会社日立製作所 情報・通信システム社

要  旨 :
NBDC実務者連絡会は、生命科学系データベースの統合を目指してバイオサイエンスデータベースセンター(NBDC; http://biosciencedbc.jp/)によって進められている2種類の研究開発プログラム(計12課題)の研究開発が、円滑かつ効率的に進展することを支援する目的で設置された。主な活動は、wikiページ(http://wg.biosciencedbc.jp/)やメーリングリストなどを通して、データベース統合の基盤となるデータのRDF化、オントロジー構築、APIなどに関する情報や技術の調査、意見交換、議論や共有を行うことである。現在、実務者連絡会のメンバーには、18機関から47名の研究者が参加し、その中には、NBDCが実施する研究開発プログラム以外の農業水産省、厚生労働省、経済産業省の生命科学系データベースの統合の担当者も含まれ、情報、技術の交流に努めている。これまでに実務者連絡会では、データベースのRDF化に不可欠となるURIの取扱いについて議論を行い、2012年に恒久的なURIの提供を保証するPURLサーバー(http://purl.jp/)の運用を開始した。さらに、データベース統合や高度なデータベース検索の実現ために必要なオントロジーに対しても情報、技術の共有、議論を深め、その開発環境の整備を進めている。

 

番  号 : 28

タイトル : 日本DNAデータバンク (DDBJ)

発 表 者:中村保一,小笠原理,神沼英里,大久保公策,高木利久

所  属 : 国立遺伝学研究所

要  旨 :
日本DNAデータバンク(DDBJ)は、米国GenBank、欧州EMBL-Bankと並ぶ国際塩基配列データベース(INSDC)の一員である。INSDCに収められたデータは、目的や国籍にかかわらず閲覧・転用が可能な科学の世界共有財であり、世界中の研究者はパートナーの三機関のいずれかを通じ、データを登録・公開することが可能となっており、伝統的な配列アーカイブは1.5億エントリ、1,400億塩基の配列データを公開している。昨年に引き続き、新型シーケンサを活用した配列情報と配列情報のプロジェクト化に対応するための新規アーカイブと解析支援系(DRA、DOR、DRA pipeline、BioProject、BioSampleなど)の開発と展望についても報告する。DDBJでは2012年の3月に実施した遺伝研スーパーコンピュータのリプレイスにより、大幅な解析・運用能力の向上が実現されたが、これまで提供してきた情報検索系の提供が一部危機的な状況となるという問題も生じた。これら環境の変化や運用体制の変化も含め、本ポスターにてDDBJ の現状を報告する。

 

番  号 : 29

タイトル : Sequence Read Archiveにおける公共NGSデータの
       シーケンスクオリティとメタデータ

発 表 者:大田達郎,坊農秀雅

所  属 : 情報・システム研究機構 ライフサイエンス統合データベースセンター

要  旨 :
次世代シーケンス(NGS)の進歩によって、個々の研究で利用される塩基配列データの規模はさらに大きなものとなっている。それに伴って、公共のNGSデータベースであるSequence Read Archive(SRA)に登録されるデータの量も増え続け、データの検索・利用が困難となっている。DBCLSでは日本DNAデータバンク(DDBJ)と協力し、SRAに登録されたデータを有効に活用するための技術開発を行なっている。これまでにデータベースに登録されたデータの詳細を記述したデータ(メタデータ)を整理し、メタデータの統計情報を元にしたデータ検索機能や、それに関連する論文と登録データの対応表の公開などを行なってきた。現在、SRAにおいてアクセスが可能な全てのデータに対してシーケンスクオリティを計算し、その結果の公開を行なっている。また、これらのメタデータに対してプログラム上から容易にアクセスするためのAPIも公開している。これらの情報の提供、およびそれを用いたウェブサービスの開発により、データの検索・利用のコストを下げ、データの再利用性を高めている。

 

番  号 : 30

タイトル : 疾患の切り口から公共データベース中のNGSデータを利活用する

発 表 者:仲里猛留,坊農秀雅

所  属 : 情報・システム研究機構 ライフサイエンス統合データベースセンター

要  旨 :
次世代シーケンシング (NGS)は、今やトランスクリプトミクスやリシーケンスなど、さまざまな目的に利用されている。また、そのデータは、公共データベースであるSequence Read Archive (SRA)に登録され、広く再利用が可能である。この中には、疾患に関連する登録も少なからずあるが、それらを探し出すには、登録者が自然文で記述したタイトルやコメントに対してキーワード検索する以外に方法はない。今回、私たちはSRAデータと論文を対応づけ、論文から疾患キーワードを抽出することでSRAデータを疾患の観点から整理した。ここでは、SRAの各エントリから文献へのリンクをたどるだけでなく、文献から本文中のSRA ID、あるいは、対応する GEO IDを抽出することで、SRAエントリと文献との対応づけを行っている。ライフサイエンス統合データベースセンターでは、目的別や機器別にSRAデータを整理、検索できるようにしたSurvey of Read Archives(http://sra.dbcls.jp/)を公開しており、疾患関連エントリについても、頻度別や、癌や感染症などの種類別に検索が行えるようになっている。

 

番  号 : 31

タイトル : 遺伝子発現リファレンスデータセット『RefEx』

発 表 者:小野浩雅,坊農秀雅

所  属 : 情報・システム研究機構 ライフサイエンス統合データベースセンター

要  旨 :
RefEx (Reference Expression dataset)は、4つの異なる実験手法(EST、GeneChip、CAGE、RNA-seq)によって得られた40種類の正常組織における遺伝子発現量を並列に表現することで、手法間の比較とともに各遺伝子の発現量を直感的に比較することが可能な、リファレンス(参照)データセットである。検索インターフェイスおよび検索結果の表示方法について大規模な刷新を行い、遺伝子名およびキーワード検索では逐次的に検索項目をサジェストすることで検索性の向上を図ったほか、さまざまな実験において比較対照などによく用いられる「組織特異的遺伝子」を発現データから独自に算出し、組織別に一覧することが可能となった。またBodyParts3Dデータを活用した発現データのヒートマップ表示機能を拡充し、組織間における遺伝子発現の差異をより直感的に理解することができるようになった。今回の発表では、RefExの開発状況や今後の展望について紹介し、実験生物学者が真に必要とする遺伝子発現リファレンスDBを開発するために多くの意見や要望を得る機会としたい。

 

番  号 : 32

タイトル : GEO目次による低酸素刺激前後のトランスクリプトームの種横断的解析

発 表 者:坊農秀雅

所  属 : 情報・システム研究機構 ライフサイエンス統合データベースセンター

要  旨 :
遺伝子発現バンク(NCBI GEO)の開始以来、論文出版の条件としてDNAマイクロアレイの生データをGEOなどの遺伝子発現バンクへの登録を義務付けるという各論文誌のデータ共有に向けた協力体制もあり、2012年半ばの現在約10年ほどで4万近くのデータセットが登録されている。
DBCLSでは統合データベースプロジェクトの開始以来、GEOに登録されているデータを測定技術と材料の属性に基づいて整理するウェブツール「GEO目次」を開発し、維持してきた(http://lifesciencedb.jp/geo/)。その結果、特定の生物種や発現解析プラットフォーム、キーワードで遺伝子発現データを検索可能なだけでなく、生物学的な興味に基づいて種横断的にデータが俯瞰できるようになってきている。
GEO目次を利用して、多くの生物種でデータが測定されている低酸素刺激前後でのトランスクリプトームを抽出し、種横断的に比較解析を行っている。
本発表では、GEO目次のRSS機能を活用することで新規に登録されるデータを監視し続けるなど、その解析手法に力点を置いてデータベース統合化によって可能となった研究の事例を紹介する。

 

番  号 : 33

タイトル : 統合遺伝子検索GGRNA

発 表 者:内藤雄樹,坊農秀雅

所  属 : 情報・システム研究機構 ライフサイエンス統合データベースセンター

要  旨 :
GGRNA(http://GGRNA.dbcls.jp/)は、遺伝子や転写産物をGoogleのようにすばやく検索できるウェブサーバである。検索キーワードとして、遺伝子名やアクセッション番号など各種のIDをはじめ、遺伝子の機能やタンパク質のドメイン名、さらには、塩基配列やアミノ酸配列など、あらゆる語句を単一の検索窓に入力するだけでRefSeqに登録された転写産物をすばやく探し出すことができる。とくに、塩基配列の検索においては、あいまいな塩基を含むパターンや3塩基までのミスマッチを含む配列にも対応し、BLASTやBLATのような一般的な配列類似性検索サイトでは検索の困難な10塩基ほどの短い配列でも高速な検索が可能である。また、GGRNAによる検索結果を外部のプログラム等で再利用しやすいよう、REST APIを提供している。今回の発表では、GGRNAウェブサーバの概要を紹介するとともに、いくつかの具体的な活用事例を取り上げた。GGRNAのすべての機能は無償で自由に利用できる。

 

番  号 : 34

タイトル : PDBjとwwPDBにおけるデータ統合化の進展

発 表 者:中村春木1),金城玲1),Daron M. Standley2)

所  属 : 1)大阪大学 蛋白質研究所,2)大阪大学 免疫フロンティア研究センター

要  旨 :
日本蛋白質構造データバンク(Protein Data Bank Japan: PDBj, http://pdbj.org/)では、昨年度に開発・公開したPDB/RDF (Kinjo et al. (2013) Nucl. Acids Res. 40, D453-D460)を国際標準のものに高度化し、URLも国際蛋白質構造データバンク(worldwide PDB: wwPDB, http:/wwpdb.org/)に統一化し、ウェブサービスとして提供している(http://rdf.wwpdb.org/pdb/)。
一方、ホモロジーモデル・エンジンのSpanner、3Dモデル構造と配列情報からファミリー予測を行うSeSAW、天然変性ドメインを発見するIDD Navigatorをパイプラインとしてつなげ、蛋白質配列情報によって蛋白質立体構造モデルを構築し、蛋白質の機能解析および推定を行うためのパイプラインSFAS(Structure & Function Prediction Pipeline)を構築・公開した。

 

番  号 : 35

タイトル : 仮想化技術による生体高分子NMR解析環境および
       BMRBデータベースサーバーの統合化

発 表 者:小林直宏,岩田武史,高橋あみ,児嶋長次郎,中村春木,藤原敏道

所  属 : 大阪大学 蛋白質研究所

要  旨 :
生体高分子の核磁気共鳴法(NMR法)は3次元構造、動的ゆらぎあるいはリガンドとの相互作用に関する情報を原子レベルで与える研究法である。米ウィスコンシン大学との共同開発を通じ、蛋白質立体構造の総合的なデータベースを管理運営するPDBjと連携しながら我々はNMR実験データのデータベースであるBMRBを登録サイトとして構築運営してきた。
これまでに我々は本データベースの登録業務の効率化を進めると共に、実際に運用している物理サーバーから仮想サーバー(P2V)あるいは仮想サーバーから仮想サーバー(V2V)へ移行させる技術により、8~12台の物理サーバーをわずか2台のサーバーに統合化する計画の実施段階に来ている。これによりサーバー管理の効率化、運用の安定化に加え省スペース化、省電力化を実現できる見込みである。
また、我々のグループはライフサイエンス研究でNMRの実験データを解析するツールとしてMagROシステムおよび関連ツール群を昨年度までに開発し、これらを基盤とするバイオインフォマティックス情報とのシームレスな連携を可能とした新バージョンの一部が公開段階に入っている。

 

番  号 : 36

タイトル : 蛋白質複合体データベース:
       human protein complex database with quality index (PCDq)

発 表 者:村上勝彦1),喜久川真悟1),西潟憲策1),佐藤慶治1),鈴木満美1)
       Altaf-Ul-Amin Md. 2),金谷重彦2),今西規1)

所  属 : 1)産業技術総合研究所,2)奈良先端科学技術大学院大学

要  旨 :
PCDqは、予測複合体を含めたヒト蛋白質複合体のデータベースです。BIND、DIP、MINT、HPRD、IntActおよびGNP_Y2Hの6つの蛋白質間相互作用(PPI)データを整理統合し、PPIネットワークの密な領域から蛋白質複合体が予測され、それらを文献と比較し、既知・予測両方の複合体情報を格納しています。既知と予測のサブユニットを区別・活用するため、各サブユニットの根拠を、1) 既知、2) 機能推定の根拠がPPI以外にある、3) PPIによる推定のみ、の3つのカテゴリで示しています。これらをまとめた複合体品質管理指数(QCI)を各複合体に付与しています。また、タンパク質の機能、局在、構造、発現、遺伝子座、および複合体間の相互作用などのデータを付与しています。さらに、複雑なネットワークを簡素に示す図を表示・編集できる機能PPI-Mapがあります。PCDqには、1,264個のヒト蛋白質複合体があり、9,268個のタンパク質と32,198個のPPIが含まれています。URLはhttp://www.h-invitational.jp/hinv/pcdq/です。

 

番  号 : 37

タイトル : 植物の比較ゲノム解析データベース-SALAD database
       -進化上保存されたアミノ酸モチーフの統合に向けて-

発 表 者:深田麻衣子,三原基弘,伊藤剛,井澤毅

所  属 : 農業生物資源研究所

要  旨 :
我々は、進化的に保存されたアミノ酸配列モチーフを分類、データベース化した比較ゲノム解析のためのSALAD databaseを公開している。現バージョンでは、対象の相同タンパク質群ごとに、保存モチーフを抽出、分類しているが、現在、13種の植物の予測プロテオーム情報(約33万配列)内のすべての進化的に保存されたモチーフに共通のIDを割り振ることを試みている。まず、BLAST解析を用いて、約30万の相同タンパク質グループを作成した。この各グループから、MEMEでPSSMモチーフを抽出し、そのPSSM群内の冗長性を除去し、かつ、上記のプロテオーム内でのサーチでは、すべてのモチーフが自己完結型になるようにトレーニングを行っている。このように作成した全モチーフにIDを割り振ることで、保存モチーフのゲノム単位の進化を議論することが可能になる。その上、新規遺伝子の発見やゲノムアノテーションの効率化、タンパク質配列の自動アノテーションシステムの構築等、日々増え続けるゲノム情報に迅速な対応が可能になると期待している。本発表では、共通のモチーフIDを付与する整理整頓の現状及び、ゲノムにおいて進化的に保存されたモチーフをGBrowseで表示した新たなツール開発の一部を紹介する。

 

番  号 : 38

タイトル : TargetMine, a data warehouse system for target discovery

発 表 者:陳怡安1),ロケシュ テリパチ1),水口賢司1), 2)

所  属 : 1)医薬基盤研究所 創薬基盤研究部 バイオインフォマティクスプロジェクト,

          2)大阪大学大学院 生命機能研究科

 

要  旨 :
For the purpose of drug discovery, we have developed TargetMine, an integrated data warehouse, which is based on the flexible InterMine framework and effectively combines biological data from several public resources [1]. It enables biological data gathering and data analysis in a single user-friendly interface and it is, thus, a useful tool to assist in candidate gene selection. We have now included in TargetMine new protein structural domain annotations from the Gene3D database based on the evolutionary relationships from the CATH database, which have enabled identification of newer associations between protein structure, molecular function, and evolution. The improved data warehouse facilitates newer and more complex queries for prioritizing targets. TargetMine has been effectively employed for target selection in a protein-protein interaction (PPI) network-based analysis of Hepatitis C virus (HCV) pathogenesis [2,3] and lung tumorigenesis [4]. The academic version of TargetMine is available at http://targetmine.nibio.go.jp/

References
1. Chen YA, Tripathi LP, Mizuguchi K (2011) TargetMine, an Integrated Data Warehouse for Candidate Gene Prioritisation and Target Discovery. PLoS ONE 6(3): e17844.
2. Tripathi LP, Kataoka C, Taguwa S, Moriishi K, Mori Y, Matsuura Y, Mizuguchi K (2010) Network based analysis of hepatitis C virus Core and NS4B protein interactions. Mol Biosyst 6: 2539-2553.
3. Tripathi LP, Kambara H, Moriishi K, Morita E, Abe T, Mori Y, Chen YA, Matsuura, Y, Mizuguchi K (2012) Proteomic analysis of hepatitis C virus (HCV) core protein transfection and host regulator PA28γ knockout in HCV pathogenesis: A network-nased study. J Proteome Res 11: 3664-3679.
4. Ihara S, Kida H, Arase H, Tripathi LP, Chen YA, Mizuguchi K et al., (2012) Inhibitory roles of signal transducer and activator of
transcription 3 in anti-tumor immunity during carcinogen induced lung tumorigenesis. Cancer Research 72, 2990-2999.

 

番  号 : 39

タイトル : 日本糖鎖科学コンソーシアム・データベース(JCGGDB)

発 表 者:鹿内俊秀1),梶裕之1),鈴木芳典1),藤田典昭1),前田真砂子1),文紅玲1)
       石崎円1),澤木弘道1),奥田修二郎2),鴨さおり2),中尾広美2),石水毅2)
       川嵜伸子2),川嵜敏祐2),山田一作3),本庄秀之3),森昌子3),弘瀬友理子3)
       水野真盛3),加藤雅樹4),菅秋次4),山口芳樹4),木下聖子5),河野信6),成松久1)

所  属 : 1)産業技術総合研究所 糖鎖医工学研究センター,
          2)
立命館大学 糖鎖工学研究センター,3)野口研究所 糖鎖有機,
        4)理化学研究所 基幹研究所,5)創価大学大学院工学研究科,
        6)情報・システム研究機構 ライフサイエンス統合データベースセンター

要  旨 :
我々は、糖鎖統合データベースであるJCGGDBのデータや機能の拡充と、統合化のための技術開発を行っている。最近、産総研からはマウスの糖タンパク質データベースを公開した。脳/大腸/心臓/腎臓/肝臓などのサンプルから、レクチン数種類を用いて糖タンパク質を捕集し、IGOT法により糖鎖の付加位置を同定した。また、立命館大学のGlycoEpitopeはこれまでに抗体585エントリー、エピトープ161エントリーの情報を公開した。そして、野口研と産総研から、有機化学の分野の研究者の協力を得て糖鎖合成のデータを収集し公開した。理研と野口研では、合成した糖鎖構造を分析できるようにNMR-DBの開発を行っている。立命館大学と産総研は、著名な研究者が実際に使用している実験プロトコル170題を公開した。
これまでに、国内にある糖鎖に関連したDBを横断的に検索できるインターフェースや、CFG単糖シンボルを利用して糖鎖構造を検索できる構造の統合インターフェースや、化学構造を利用して糖鎖関連の構造検索インターフェースを開発した。糖鎖研究を始めたばかりの人から糖鎖科学を熟知した研究者まで幅広いユーザ層に満足して頂けるインターフェースの開発を目指しプロジェクトを推進している。

 

番  号 : 40

タイトル : 理研糖鎖コンフォメーションデータベース

発 表 者:加藤雅樹,山口芳樹

所  属 : 理化学研究所 基幹研究所 システム糖鎖生物学研究グループ
        糖鎖構造生物学研究チーム

要  旨 :
糖鎖は、タンパク質の品質管理や細胞間のコミュニケーション等において重要な役割を担っており、これらの糖鎖の機能を理解する上でも糖鎖および糖鎖関連タンパク質の立体構造に関する知見は必須のものである。
公的な生体高分子の立体構造データベースProtein Data Bank(PDB)の中にも糖鎖の情報が多く含まれているものの、PDB中の糖鎖の約30%は、結合様式や糖の種類などに関して誤りが含まれていると報告されている。そこで、我々は立体構造情報から糖鎖の自動アノテーションを行うプログラムを構築し、これを元にPDB中から糖鎖および糖鎖関連タンパク質のデータにアノテーションやグリコシド結合の角度等の情報を付加したデータベース(理研糖鎖コンフォメーションデータベース)を構築した。また、PDB中の単糖はアミノ酸と同様3文字コードで表記されているが、統一された表記ルールが存在せず、他の糖鎖関連データベースとの関連付けが困難になっている。本データベースでは立体構造情報から単糖を同定することにより、他の糖鎖関連データベースとの関連づけを可能にした。

 

番  号 : 41

タイトル : グライコナビ:化学構造式検索

発 表 者:山田一作,本庄秀之,弘瀬友理子,森昌子,水野真盛

所  属 : 野口研究所 糖鎖有機

要  旨 :
野口研究所では、糖質研究を支援するためのツールとしてGlycoNAVIを開発している。GlycoNAVIデータベースは、糖質科学研究において重要な糖鎖標準品の化学合成に関連する、低分子化合物や化学合成反応等のデータを格納しているデータベースである。このデータベースのデータを化学構造式から検索するシステムを構築した。本検索システムは、化学構造式クエリの作成に、GlycoNAVI Suites:CSEditorを利用し、新たに構築した検索用Webサービスとの連携機能をCSEditorに付加することで構築した。検索用Webサービスは、化学構造式クエリに対して、完全一致および部分一致検索の結果を、分子ID一覧で出力する。ユーザは、CSEditorを利用し、化学構造式クエリより得られた検索結果一覧から分子IDを選択することで、その化学構造式および反応IDを表示することができる。さらに、反応IDを選択することで化学合成反応式を表示することができる。これらの分子及び反応情報の詳細は、ウェブブラウザを用いて表示できる。さらに、各分子についてNMRスペクトル、TLC、精製法などの付加情報がある場合は、付加データを表示することができる。今後、利用者の意見を取り入れることにより、活用されるシステムを構築していきたいと考えている。

 

番  号 : 42

タイトル : BioLOD:フェノームおよびバイオリソース情報の統合と共有

発 表 者:土井考爾1),西方公郎1),下山紗代子1),桝屋啓志2),豊田哲郎1)

所  属 : 1)理化学研究所 生命情報基盤研究部門,2)理化学研究所 バイオリソースセンター

要  旨 :
遺伝子型と環境条件に依拠して観察される生物の表現型の集合であるフェノームの情報は、各種オミックスや観察対象となるバイオリソース(変異株系統や生態型など)情報と関連付けて研究コミュニティで共有することで生物情報学研究の発展をもたらす。我々は、様々な生物情報学的データをW3CのLODプロジェクトに準拠した標準形式で提供するべく、BioLOD(Biological Linked Open Data)サイトを構築した。その一環としてマウスやシロイヌナズナなどの変異株系統について、変異株ごとのフェノーム、遺伝子情報などを公開している。フェノームはオントロジーで標準化され、関連する情報同士は相互にリンクされている。BioLODには、PosMedによる推論検索システムも統合されており、任意のキーワードについて、関連する情報を推論的に検索し、様々な観点からランク付けして閲覧できる。BioLODを通じて、研究者は表現型-遺伝子、表現型-バイオリソース(変異株)などの関係情報を様々なファイル形式で取得可能である。また、各人の手持ちのデータを投稿する仕組みも用意しており、多様な情報の共有化が期待できる。

 

番  号 : 43

タイトル : 生命動態システム科学のデータベースの統合化

発 表 者:大浪修一

所  属 : 理化学研究所 生命システム研究センター 発生動態研究チーム

要  旨 :
生命動態システム科学は「生命を動的システムとして理解し、操作する生命科学」であり、新たな生命科学研究の潮流として、21世紀の科学全体に大きな影響を与えると期待されている。当分野では、様々な摂動条件下の生命現象の動態の時空間定量計測データや、様々なパラメータ下の生命現象の時空間シミュレーション結果等、時空間情報を含む従来とは異なる新しい様式の生命科学研究のデータが大量に生産されている。本課題では、今後のデータの大規模な集積に向けて、当分野の全てのデータベースが開発と並行して統合化される体制を構築し、当分野の全てのデータベースを将来にわたり統合化することを目指す。本発表では、本課題の計画の概要と、現在までの進捗状況を発表し、今後の課題について議論する。

 

番  号 : 44

タイトル : NBDC/DBCLS BioHackathon 2012 報告

発 表 者:NBDC/DBCLS BioHackathon オーガナイザ(山口敦子,岡本忍,川島秀一,河野信,
       金進東,呉紅艶,山本泰智,王悦,片山俊明)

所  属 : 情報・システム研究機構 ライフサイエンス統合データベースセンター

要  旨 :
国際会議 BioHackathonは生物学のデータに対して、先端技術を用いたシステムやプログラム開発を行なっている現場の研究開発者が参集し、合宿形式で分野横断的に問題解決にあたる、ユニークな形式の国際会議である。ライフサイエンス統合データベースセンター(DBCLS)では、2008年に第一回を開催して以降、5回にわたってBioHackathonを開催してきた。今年度は、2012年9月2日~7日、富山国際会議場および大山研修センターにて、NBDC/DBCLS BioHackathon 2012として、バイオサイエンスデータベースセンター・DBCLS主催で開催された。今年度のテーマは「LinkedOpenDataにおけるライフサイエンス応用」であり、このテーマおよび周辺のトピックについて活発な議論と開発が行われた。本発表では、会議内容およびその成果について報告する。

 

番  号 : 45

タイトル : 生命科学データに適したトリプルストア調査

発 表 者:呉紅艶1),藤原豊史2),山本泰智1),山口敦子1)

所  属 : 1)情報・システム研究機構 ライフサイエンス統合データベースセンター,
          2)
株式会社インテック

要  旨 :
セマンティックウェブ技術を用いたデータベース統合において、RDFデータを格納するトリプルストアを適切に選択することは、検索速度において非常に重要である。しかし、生命科学データは巨大なため、Berlin SPARQL Benchmarkなどの従来のベンチマークテストは十分ではなかった。そこで、生命科学データに適したトリプルストアを選択するために、入手可能な生命科学分野のRDFデータを用いて性能比較を行った。具体的には、Cell cycle ontology、Allie、PDBj、UniProt、DDBJのサイズが大きく異なる5つのデータセットを用意し、OWLIM-SE、Virtuoso、4store、Bigdata、Mulgaraの5種のトリプルストアに対して、ロード時間、クエリ応答時間の測定などを行った。本発表では、このトリプルストアの性能比較結果について述べる。

 

番  号 : 46

タイトル : 情報統合化・知識発見のためのキュレーション支援

発 表 者:岡本忍,山本泰智

所  属 : 情報・システム研究機構 ライフサイエンス統合データベースセンター

要  旨 :
高い有用性をもつライフサイエンス分野のデータベースを維持更新するには、データ名寄せや情報の内容を特徴付ける視座の整理など、さまざまな粒度で永続的な人手による恊働作業が必要である。このような作業をデータベースキュレーションと呼ぶ。この作業は、非常に重要であるにもかかわらず、学術的、体系的な取り組みが少なく、方法論や支援技術が蓄積されていない。本プロジェクトでは、実際のオントロジー開発やデータマッピング、文献アノテーションをとおして、人手による恊働キュレーション作業を技術・管理運営面から支援する方法論やツールを整備している。また、データベースの再利用性を高めるため、ライフサイエンス統合データベースセンターでは関連データベースをResource Description Framework (RDF)モデルで表現する研究開発を進めている。これまでに略語に関するデータベースAllieやライフサイエンス辞書、論文の引用関係や引用コメントに関するデータベースをRDFモデルで表現した。さらに、既に当該モデルで表現されているDBpediaや生物学辞書へのリンクも生成した。これらの作業について報告する。

 

番  号 : 47

タイトル : 世界のバイオデータベースの統合化をめざしたリンク自動管理システム

発 表 者:今西規

所  属 : 産業技術総合研究所 バイオメディシナル情報研究センター

要  旨 :
生命科学分野の世界の主要なデータベースを統合的に利用できる情報基盤の構築をめざし、各データのID番号の対応関係を整理・統合化したデータベース「リンク自動管理システム」を開発している(http://biodb.jp/)。ヒト、マウス、ラット、ホヤの各種分子情報と、薬剤・化合物の計5分野について、全データベースの芋づる式一括検索、ID一括変換、ID対応表のダウンロード、ID種類識別のサービスを提供している。ウェブサービスによる利用も可能である。2012年8月時点で統合化したデータベースはヒトの分子情報に関する36種類、マウスの17種類、ラットの11種類、ホヤの12種類、薬剤・化合物の15種類であり、取扱うIDの総数は130,906,368件である。本システムは一般の研究者にとって便利であるだけでなく、本サイトが提供するCGIを呼び出すことによってリンクを動的に生成することができるため、データベース開発者の作業を劇的に軽減させることができる。われわれは本システムをさらに発展させ、世界中に散在する生命科学分野の主要なデータベースをバーチャルに統合化してゆく計画である。

 

番  号 : 48

タイトル : NBDCが公開するデータベース横断検索サービスの現状

発 表 者:大波純一1),杉崎太一朗2),青木健一2),牧口大旭2),奥村利幸2),川本祥子3)
       畠中秀樹1),三橋信孝1)

所  属 : 1)科学技術振興機構 バイオサイエンスデータベースセンター,
          2)
三井情報株式会社,
        3)情報・システム研究機構 ライフサイエンス統合データベースセンター

要  旨 :
バイオサイエンスデータベースセンターではデータベースの一括検索ツールとして「生命科学データベース横断検索」を公開している。これは国内を中心とする生命科学系データベースや日本語の総説・研究報告書・特許公報・学会要旨等を対象としており、DB数は2012年8月時点で327件に上る。現在は文部科学省以外の省庁が開発するDBとの相互利用も開始し、Integbioデータベースカタログとの連携など機能強化も進めている。いくつかのDBについては予めデータ構造や格納場所を分析してインデックス情報としているため、動的なDBサイトや深層Webの検索が不得手な他のWeb検索サービスの結果と比べて、より高品質な検索結果を取得することができる。また、46件の蛋白質関連DB(2012年8月時点)を対象とするID経由型横断検索サービスTogoProt(蛋白質関連データベース統合検索)についても品質向上が進められている。これらの横断検索システムは、利用者がWeb上に散在する生命科学系ビッグデータに効率的にアクセスし、新しい知見が得られる基盤となることを目指している。

 

番  号 : 49

タイトル : 創薬・疾患研究のための生命科学分野のデータベース一括横断検索 Sagace

発 表 者:伊藤真和吏1),森田瑞樹1), 5),五十嵐芳暢2),陳怡安1),長尾知生子1)
       坂口由希3)坂手龍一4),増井徹3),水口賢司1), 6)

所  属 : 1)医薬基盤研究所 創薬基盤研究部 バイオインフォマティクスプロジェクト,
          2)
医薬基盤研究所 創薬基盤研究部 トキシコゲノミクス・インフォマティクスプロジェクト,
        3)医薬基盤研究所 難病・疾患資源研究部 政策・倫理研究室,
        4)医薬基盤研究所 難病・疾患資源研究部 難病資源研究室,
        5)東京大学 知の構造化センター,6)大阪大学大学院生命機能研究科

要  旨 :
医薬基盤研究所では、昨年度JSTバイオサイエンスデータベースセンターと連携し、データベース横断検索システム “Sagace http://sagace.nibio.go.jp/”を開発した。Sagaceは創薬・疾患に関連する国内のデータベースを検索対象としている。
インターネット上には、数多くの種類の検索エンジンが存在する。しかし、これらの検索エンジンは特定の専門分野のデータを効率良く得ることが苦手である。一方で創薬・疾患分野の検索システムは多種多様な形式のデータベースを横断的に検索し、一度に表示することは不得手である。そこで我々はユーザーが探している創薬・疾患に関連した情報を得やすくするような検索エンジンを開発した。
Sagaceでは、医薬基盤研究所のプロジェクトメンバーが医学/生命科学に特化したデータベースの選定・分類をすることで、有用な結果が検索の上位に現れるように工夫している。また、ファセット(データベースの特徴ごとの分類項目)を使用することで効率的に絞り込みをすることが出来、メタデータ(データそのものに関する情報のデータ)を活用することで、データベース自身の情報を知ることが出来る。こうした仕組みを利用することで、創薬・疾患に特化したデータを効率的に得ることが出来る。

 

番  号 : 50

タイトル : TogoTable: RDF技術を利用したテーブル形式データへの
       自動アノテーション付加ツール

発 表 者:河野信1),渡辺敦2),水口惣平3),荒木令江3),片山俊明1),山口敦子1)

所  属 : 1)情報・システム研究機構 ライフサイエンス統合データベースセンター,
          2)
クロスエッジ・システムズ,3)熊本大学大学院生命科学研究部

要  旨 :
BLASTなどのデータ解析ソフトからの出力ファイルには、アノテーション情報としてEntrezのGene IDやUniProt IDなどが付加されている場合があるが、それらのエントリに書かれている詳細なアノテーション情報に関しては記載されない場合がほとんどである。解析結果を適切に解釈するためには、詳細なアノテーション情報を一覧できると便利である。TogoTableはデータベースIDを含むテーブル形式のデータに対して、任意のアノテーション属性をRDF化されたデータベースから自動的に取得し、テーブルに追加する。現在はUniProtとDDBJの限られたデータセットのみに対応したベータ版であるが、今後はRefSeq、PDBj等の主要DBや、バイオサイエンスデータベースセンターが提供しているデータベースアーカイブのデータ等にも検索対象を拡大し、データベースをまたいだアノテーション取得を実現するなど、LinkedDataの特性を活用した機能を実装する予定である。TogoTableのベータ版は http://togotable.dbcls.jp/ から無料で利用可能である。

 

番  号 : 51

タイトル : RDFゲノム:セマンティックウェブによるリファレンスとしての
       ゲノム知識基盤の開発

発 表 者:片山俊明1),岡本忍1),川島秀一1),藤澤貴智2),森宙史3)

所  属 : 1)情報・システム研究機構 ライフサイエンス統合データベースセンター,
          2)
国立遺伝学研究所,3)東京工業大学大学院生命理工学研究科

要  旨 :
ゲノム情報があらゆる生物医学研究の基盤となって久しいが、次世代シーケンサによる大量配列情報が近い将来にラボや個人のレベルでも次々と生産されるようになることは間違いない。現状でもメタゲノム研究やコホート研究などで得られる大量の配列からどのように結果を解釈できるかが問われており、既存の知識を集積した共通基盤としてのデータベース整備と、その利用のためのインターフェイス開発が急務といえる。 NCBI や EBI によるゲノムデータベースの他、ヒトやモデル生物のための UCSC や GMODをはじめとした個別のデータベースが乱立する中で、今後ますます必要とされる統一的なリファレンスとしての知識基盤を借り物のデータベースで賄うことは困難である。ライフサイエンス統合データベースセンター(DBCLS)ではDDBJ と連携して、ゲノム情報と関連情報の RDFによるモデルの標準化を推進し、再利用可能で高度な検索レポートシステムの構築、アノテーションシステムの開発を目指している。今後は国内外の研究コミュニティや BioHackathon による国際連携などを通じて、将来にわたって世界的にも利用される次世代のゲノムデータベースとツール開発を行い、微生物からヒトまで研究者や一般の利用者が配列データを容易に解釈できるプラットフォームを構築したい。

 

番  号 : 52

タイトル : 解析プラットフォームによる統合利用環境の構築

発 表 者:福井一彦,田代俊行,矢葺幸光,浅井潔

所  属 : 産業技術総合研究所 生命情報工学研究センター

要  旨 :
産業技術総合研究所 生命情報工学研究センター(CBRC)では、センター内外のデータベース、ソフトウェアを最新の情報技術を用いてシームレスに統合したバイオインフォマティクス利用基盤の構築に取り組んでいます。本開発では、ユーザが処理の組み合わせを指定することが可能であり、使いやすさを考慮した柔軟性、操作性に優れたプラットフォーム上で動作するワークフロー構築を行っています。このプラットフォームを用い、ノード化されたCBRC独自の解析ツール・ソフトウェアのプログラム群や外部ツール及びデータベース等をインタラクティブに接続し、独自の解析ワークフローを構築することが可能です。この解析ツールのサービスはSOAP通信に対応しており、ローカルPCによる処理と計算機パワーが必要とされる計算処理の部分を切り分けています。またDBのRDF化に伴い、開発した高度な解析ツール群を広く利用可能とするために、セマンティック技術に対応したSADI(Semantic Automated Discovery and Integration)フレームワークを利用して、解析ツールにRDF入出力機能を追加し、連携型DBと組み合わせた大規模解析を可能とする解析サービスやツール群のオントロジー開発を行っています。

 

番  号 : 53

タイトル : BodyParts3D/Anatomography

発 表 者:大久保公策1),藤枝香1),三橋信孝2)

所  属 : 1)情報・システム研究機構 ライフサイエンス統合データベースセンター,
          2)
科学技術振興機構 バイオサイエンスデータベースセンター

要  旨 :
<意図> Google Earthやゲノムブラウザのような「直観知識を動員できる座標系」を企図しています。データ・文書⇒統制語オントロジー等での索引付⇒マップ整理⇒視覚の流れを助けます。作成画像やデータはCC-BY-SAで利用転用自由、医学情報に標準座標を提供します。
[BodyParts3D] <定義>人体モデルを解剖学的に分節したポリゴンデータのサーバです。<仕組>データは専任の医科イラストレータがMRIや模型データを材料に作成しています。データファイルは解剖概念と対応して作成され現在1,523の概念IDに対応しています。概念IDは解剖オントロジー Foundation Model of Anatomy(FMA) of Wash-Uを使っています。<利用>ポリゴンファイルはNBDCサーバからダウンロード可能です。
[Anatomography] <定義>BodyPartsデータを組み合わせて3Dアバター化し、利用するサーバです。<仕組>パラメータ群(パーツIDと色・透過率・視点等)を指定するGUIとイメージを返すレンダリングサーバから成ります。サーバはAPIを持ちパラメータ付URLリクエストに指定されたイメージを返します。アバター中の任意の3次元座標に病変位置等の注釈をつけることができます。<利用>アバターは注釈とともにテキスト(パラメータ付URL)として保存でき埋め込み表示も簡単です。

URL: http://lifesciencedb.jp/bp3d/

 

番  号 : 54

タイトル : 新たな日本語Webコンテンツ「ライフサイエンス 領域融合レビュー」

発 表 者:飯田啓介

所  属 : 情報・システム研究機構 ライフサイエンス統合データベースセンター

要  旨 :
ライフサイエンス統合データベースセンターは、日本分子生物学会、日本蛋白質科学会、日本細胞生物学会、日本植物生理学会との協力のもと、新たな日本語Webコンテンツとして、「ライフサイエンス 領域融合レビュー」の公開をスタートした。これは、生命科学分野の学問分野・領域を広く総合的にとりあげる日本語による総説(レビュー)を、だれでも自由に閲覧・利用できるようWeb上にて無料で継続的に公開するものである。公開されたレビューはクレジットの明記を条件に自由に転載・改変・再利用(営利目的での二次利用も含め)を行える。広く生命科学全般にかかわる教員・研究者および大学院生・学生を対象とし、とくに読者として生命科学において専門分野の異なる人を意識している。また、よりわかりやすいものとするため、用字・用語の統一にくわえ、生命科学専門の編集者の視点から一文一文を吟味して大胆な修正を行っている。2012年度は、年間10本程度の公開を予定している。領域の研究成果あるいは研究動向についての情報源としてだけでなく、有用なデータベースとしての機能をもはたすことで、サイエンスコミュニティ全体に寄与することを目的としている。