ポスター発表は以下の日程で行います。

【10月5日(月)】
 ライトニングトーク①  奇数番号 14:00 ~ 14:30
 ポスター発表①     奇数番号 14:30 ~ 15:50

【10月6日(火)】
 ライトニングトーク②  偶数番号 13:50 ~ 14:20
 ポスター発表②     偶数番号 14:20 ~ 15:40

発表者はこちら(ポスター様式、ポスター設置・撤去などのタイムスケジュール等)を ご覧ください。

※ポスターや発表スライド等の著作権は、別途記載がない限り発表者・発表者の所属機関に帰属します。
 ポスター・スライド内の図や文言を転用する際には、著作者と話し合っていただくようお願いいたします。
番号  代表発表者所 属タイトル 発表資料
1  大波純一 科学技術振興機構 バイオサイエンスデータベースセンター 生命科学データベース横断検索のメタ情報利用とインフラ環境強化 pdf-i
2  信定知江 科学技術振興機構 バイオサイエンスデータベースセンター データベース統合に向けてのIntegbioデータベースカタログの活用 pdf-i
3  畠中秀樹 科学技術振興機構 バイオサイエンスデータベースセンター 生命科学系データベースアーカイブのRDF化による統合への取り組み pdf-i
4  飯田啓介 情報・システム研究機構 ライフサイエンス統合データベースセンター 日本語Webコンテンツ、「新着論文レビュー」と「領域融合レビュー」UPDATE pdf-i
5  小野浩雅 情報・システム研究機構 ライフサイエンス統合データベースセンター 人材育成教材ポータルサイトとしての統合TV pdf-i
6  山口敦子 情報・システム研究機構 ライフサイエンス統合データベースセンター SPARQL Builder: 生命科学系データベースを対象としたSPARQLの半自動生成ツール pdf-i
7  川島秀一 情報・システム研究機構 ライフサイエンス統合データベースセンター RDF化ガイドラインの提案 pdf-i
8  山本泰智 情報・システム研究機構 ライフサイエンス統合データベースセンター 関係データベースを効率的にRDF化するD2RQ Mapper pdf-i
9  片山俊明 情報・システム研究機構 ライフサイエンス統合データベースセンター BioHackathonのレポートとDBCLSサービス開発の進展 pdf-i
10  高月照江 理化学研究所 バイオリソースセンター 表現型情報統合のためのデータ作成 pdf-i
11  戀津魁 理化学研究所 情報基盤センター ライフ系データの流通・統合を目指した理研メタデータベース運用の試み pdf-i
12  森宙史 東京工業大学大学院 生命理工学研究科 微生物統合データベースMicrobeDB.jpの超高度化 pdf-i
13  藤澤貴智 情報・システム研究機構 国立遺伝学研究所 生命情報研究センター GenomeRefine: ゲノム・メタゲノム解析データに対してアノテーションするウェブサービス pdf-i
14  鈴木真也 東京工業大学大学院 生命理工学研究科 微生物統合データベースのための微生物採取環境オントロジーと解析アプリケーションの開発 pdf-i
15  山本希 東京工業大学 地球生命研究所 疾病関連語句オントロジーを利用したゲノム、メタゲノムデータのRDF化と利用 pdf-i
16  櫛田達矢 科学技術振興機構 バイオサイエンスデータベースセンター NBDC版日化辞RDFデータの公開 pdf-i
17  時松敏明 情報・システム研究機構 ライフサイエンス統合データベースセンター 天然化合物関連情報の統合に向けた、生合成を考慮した化学構造分類とRDF化への取り組み pdf-i
18  山田一作 野口研究所 糖質関連化合物構造のRDFによる統合化 pdf-i
19  松原正陽 野口研究所 炭素鎖表現の系統化に基づく単糖および糖鎖構造の包摂関係表現 pdf-i
20  鹿内俊秀 産業技術総合研究所 糖鎖技術研究グループ 糖タンパク質の位置特異的グライコフォームのデータベース
21  藤田典昭 産業技術総合研究所 糖鎖技術研究グループ 疾患関連糖鎖オントロジーのユーザインタフェース開発 pdf-i
22  ソロビヨワ・
   イェレナ
産業技術総合研究所 糖鎖技術研究グループ 糖鎖関連の遺伝性疾患と感染症に関するオントロジーの開発 pdf-i
23  新町大輔 創価大学 GlyTouCan:国際糖鎖構造リポジトリの開発 pdf-i
24  福井一彦 産業技術総合研究所 創薬分子
プロファイリング研究センター
経済産業省関連ライフサイエンス・ポータルサイト MEDALS pdf-i
25  坂手龍一 医薬基盤・健康・栄養研究所 創薬・疾患研究への活用に向けたデータベース連携 pdf-i
26  森田瑞樹 医薬基盤・健康・栄養研究所 バイオインフォマティクスプロジェクト 創薬・疾患研究のためのデータベース検索システム Sagace & Toxygates pdf-i
27  陳怡安 医薬基盤・健康・栄養研究所 バイオインフォマティクスプロジェクト 創薬の初期研究における統合データウェアハウスTargetMine pdf-i
28  五十嵐芳暢 医薬基盤・健康・栄養研究所 トキシコゲノミクス・インフォマティクスプロジェクト トキシコゲノミクスデータの統合化を目指したOpen TG-GATEsの再RDF化について pdf-i
29  田辺麻央 京都大学 化学研究所 薬剤耐性のシグネチャーKOとシグネチャーモジュール pdf-i
30  米納朋子 京都大学 化学研究所 医薬品階層に基づく医薬品相互作用ネットワーク解析 pdf-i
31  早野崇英 情報・システム研究機構 国立遺伝学研究所 HLA遺伝子完全配列決定パイプラインの構築 pdf-i
32  河野信 情報・システム研究機構 ライフサイエンス統合データベースセンター ヒトゲノム変異情報のRDF化 pdf-i
33  川嶋実苗 科学技術振興機構 バイオサイエンスデータベースセンター バイオサイエンスデータベースセンター(NBDC)ヒトデータベースの運用報告 pdf-i
34  仲里猛留 情報・システム研究機構 ライフサイエンス統合データベースセンター NGSデータ利活用促進のための公共データベースの役割 pdf-i
35  坊農秀雅 情報・システム研究機構 ライフサイエンス統合データベースセンター 公共遺伝子発現データを活用するためのツールRefExとAOE pdf-i
36  沖真弥 九州大学大学院 医学研究院
発生再生医学分野
既報のChIP-seqデータをフル活用するための統合データベース pdf-i
37  大田達郎 情報・システム研究機構 ライフサイエンス統合データベースセンター 軽量仮想環境による再現性を担保したデータ解析ワークフローの構築とその共有 pdf-i
38  中野祥吾 静岡県立大学 食品栄養科学部
食品生命科学科
タンパク質-リガンド間の高精度全電子計算の実行を支援するPyMOLプラグイン、PaicsPyの開発 pdf-i
39  内藤雄樹 情報・システム研究機構 ライフサイエンス統合データベースセンター GGRNA/GGGenome:塩基配列データベースをすばやく検索するウェブツール pdf-i
40  桂樹哲雄 豊橋技術科学大学大学院 工学研究科 配合生薬の横断検索のためのスマートフォン向けアプリケーションの開発 pdf-i
41  有田正規 理化学研究所 環境資源科学研究センター 代謝物リストの見本を載せるデータベースの開発 pdf-i
42  小林直宏 大阪大学 蛋白質研究所 生体高分子NMRデータベース(BioMagResBank)の統合化とその応用 pdf-i
43  金城玲 大阪大学 蛋白質研究所 蛋白質構造データバンク(PDBj)の高度化と統合的運用 pdf-i
44  守屋勇樹 情報・システム研究機構 ライフサイエンス統合データベースセンター jPOST (Japan Proteome Standard Repository/Database):プロテオーム・データの標準化と統合 pdf-i
45  遠里由佳子 理化学研究所 生命システム研究センター
発生動態研究チーム
SSBD:生命動態情報と細胞・発生画像情報の統合データベース pdf-i
46  京田耕司 理化学研究所 生命システム研究センター
発生動態研究チーム
BDML:生命現象の時空間動態に対する定量データを記述する言語 pdf-i
47  中谷明弘 大阪大学大学院 医学系研究科 遺伝子オルソログDBによる植物ゲノムDBの統合 pdf-i
48  市原寿子 かずさDNA研究所 植物ゲノム情報活用のための統合研究基盤の構築 pdf-i
49  田中剛 農業生物資源研究所 農学系ゲノム研究解析支援システムGalaxy/NIASの運用 pdf-i
50  中村保一 情報・システム研究機構 国立遺伝学研究所 DDBJセンター DDBJ: Status 2015 pdf-i
51  内山郁夫 自然科学研究機構 基礎生物学研究所 大規模比較解析に向けた微生物ゲノムデータベースMBGDの拡張 pdf-i
52  千葉啓和 自然科学研究機構 基礎生物学研究所 セマンティックWeb技術を用いたオーソログデータベースの統合化 pdf-i
53  箕輪真理 科学技術振興機構 バイオサイエンスデータベースセンター Global Alliance for Genomics and Health(GA4GH)全体会議(第3回)参加報告 pdf-i






番 号 1
タイトル 生命科学データベース横断検索のメタ情報利用とインフラ環境強化
発表者 〇大波純一1)、杉崎太一朗2)、青木健一2)、平井信一2)、牧口大旭2)、川本祥子3)、畠中秀樹1)、
三橋信孝1)
所 属 1)科学技術振興機構 バイオサイエンスデータベースセンター 2)三井情報株式会社 3)情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  Web 上に公開されている多様な生命科学系公開データベースを、深層ウェブのエントリも含めて一律にテキスト一致検索を行うための基盤として、「生命科学データベース横断検索」を公開している。現環境はライフサイエンス統合データベースセンターの協力の元、医薬基盤・健康・栄養研究所、農業生物資源研究所、産業技術総合研究所・創薬分子プロファイリング研究センター、産業技術総合研究所・糖鎖創薬技術研究センターが協調してインフラ整備とデータ更新を実施する体制となっている。利用者はここから533 件のデータベース、68,549,042 件のエントリ(2015 年7 月時点)に直接アクセスすることができ、研究テーマに絞った情報の抽出や先行研究の状況調査を効果的に行うことができる。また、各エントリから抽出されたメタ情報を利用するため、キーワード以外の検索条件(生物種や更新時期)を指定できる詳細検索機能の公開を開始した。この一方で、対象のデータベースの数は3 年間で1.6 倍、エントリの数は5.5 倍に増え、検索速度等のパフォーマンス低下が指摘されていた。そこで2014 年後半から、ハード環境の刷新と検索エンジンの刷新を実施している。この大規模な検索基盤の現在と未来について報告する。
発表資料  pdf-i
番 号 2
タイトル データベース統合に向けてのIntegbio データベースカタログの活用
発表者 〇信定知江1)、坂東明日佳1)、宮崎敦子1)、畠中秀樹1)、藤澤貴智2)、大久保克彦3)、井上圭介4)、
箕輪真理1)
所 属 1)科学技術振興機構 バイオサイエンスデータベースセンター 2)情報・システム研究機構 国立遺伝学研究所 生命情報研究センター 3)株式会社日立製作所 4)株式会社日立公共システム
要 旨  「Integbio データベースカタログ(http://integbio.jp/dbcatalog)」は文部科学省・厚生労働省・農林水産省・経済産業省の連携のもと、主に国内で作成された生命科学系データベース(DB)の所在とその概要を提供するサービスとして始まった。成果報告書等を利用した既存DB の所在調査とその収載が一通り完了し、現在1500 件近くの国内外の生命科学系DB 情報が集積されている。
 我々は集積されたDB 情報をより活用するため、Integbio データベースカタログのもつ各DB 情報をResource Description Framework(RDF)によって記述することを試みている。これは生命科学系DB のRDF を用いた統合検索において、基盤情報の1つとなることが期待される。
 また、本カタログに国内の生命科学系DB 情報が網羅的に集積されていることを利用し、各DB におけるデータの一括ダウンロード・サイトやその利用許諾、データ説明の所在を網羅的に調査した。これらは本カタログ内で公開予定であり、各DB におけるデータの再利用性を高める等、生命科学系データベースアーカイブの補完的役割を果たすことが期待される。
発表資料  pdf-i
番 号 3
タイトル 生命科学系データベースアーカイブのRDF 化による統合への取り組み
発表者 信定知江1)、大久保克彦2)、井上圭介3)、熊谷禎洋2)、〇畠中秀樹1)
所 属 1)科学技術振興機構 バイオサイエンスデータベースセンター 2)株式会社日立製作所 3)株式会社日立公共システム
要 旨  生命科学系データベースアーカイブは、国内で産生されたデータをダウンロード可能な形で長期間維持するサービスであり、既に100 件を超えるデータベース(DB)が登録されている。さらにDB の再利用・再構築を介して統合を進めるために、Resource Description Framework(RDF)関連の整備を進めている。
 TogoDB による自動RDF 化では、ID をリテラルで含む目的語をURI 化した後クラスを定義することを進めており、クエリ作成支援ツールSPARQL Builder の適用を試みる予定である。さらに、昨年度までにRDF 化した2つのサービス、ヒト遺伝子統合検索HOWDY と蛋白質関連DB 統合検索 TogoProt に加え、日本化学物質辞書Nikkaji RDF についても絞り込みダウンロードサービス等を構築中で、これを機会に遺伝子・蛋白質・化合物3種のハブDB とアーカイブDB の連携を試みる。
発表資料  pdf-i
番 号 4
タイトル 日本語Web コンテンツ、「新着論文レビュー」と「領域融合レビュー」UPDATE
発表者 〇飯田啓介
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  ライフサイエンス統合データベースセンターは、日本語Web コンテンツとして、「ライフサイエンス 新着論文レビュー」および「ライフサイエンス 領域融合レビュー」を公開している。「新着論文レビュー」は、トップジャーナルに掲載された日本人を著者とする生命科学分野の論文について、論文の著者自身の執筆による日本語のレビューを、だれでも自由に閲覧・利用できるよう、いち早く公開するもので、すでに850 本近くが公開されている。「領域融合レビュー」は、生命科学において注目される分野・学問領域における最新の研究成果について、第一線の研究者の執筆による日本語のレビューを、だれでも自由に閲覧・利用できるよう、無料で公開するもので、すでに50 本近くが公開されている。ともに、広く生命科学全般にかかわる教員・研究者および大学院生・学生を対象とし、とくに読者として生命科学において専門分野の異なる人を意識している。よりわかりやすいものとするため、用字・用語の統一にくわえ、生命科学専門の編集者の視点から一文一文を吟味して大胆な修正を行っている。公開されたレビューはクレジットの明記を条件に、自由に転載・改変・再利用を行える。
発表資料  pdf-i
番 号 5
タイトル 人材育成教材ポータルサイトとしての統合TV
発表者 〇小野浩雅、坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  統合TV は、生命科学分野の有用なデータベースやツールの使い方を動画で紹介するウェブサイトとして、2007年7 月から運用しているサービスである。サービス開始以来、現在900 本以上の解説動画を作成・公開している。
 また、ライフサイエンス統合データベースセンター(DBCLS)では、生命科学系のデータベースやツールの使い方を紹介する講習会、AJACS (All Japan Annotator/Curator/System database administrator) を開催している。そこで使われた講習資料は、初学者のための教材として再利用されるよう広く公開している。
 しかし、これらの多くの教材については、それぞれ歴史的な経緯から別々のウェブサイトで公開されており、それぞれ連携が良いとは言いがたい。
 そこで今回、これらの教材をより有機的に連携させること、また生命科学分野の人材育成教材のポータルサイトとして機能させることを目的として、統合TV ウェブサイトのリニューアルを試みた。
 本発表では、リニューアル公開されたウェブサイトの機能紹介をするとともに、利用者の観点から改善点や要望などをいただく機会としたい。
発表資料  pdf-i
番 号 6
タイトル SPARQL Builder: 生命科学系データベースを対象としたSPARQL の半自動生成ツール
発表者 〇山口敦子1)、古崎晃司2)、戀津魁3)、呉紅艶1)、山本泰智1)、小林紀郎3)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター 2)大阪大学 産業科学研究所 3)理化学研究所 情報基盤センター
要 旨  生命科学で扱う多様なデータを有機的に統合するために、セマンティックウェブ技術を活用したデータベース構築が広く行われるようになってきた。RDF (Resource Description Framework)化され、SPARQL エンドポイントを公開する生命科学系データベースの数は年々増加している。生物学研究者の多種多様な要望に対応したデータ処理を行うためには、SPARQL エンドポイントを有効に活用したアプリケーション開発が必要となる。しかし、SPARQL クエリは RDF データのグラフ構造を熟知していなければ記述することができない。そこで、あらかじめRDF データ構造を知らなくても、GUI(グラフィカルユーザインターフェース)上の操作によって、生物学研究者が欲するデータを取得するSPARQL クエリを生成できるサービスSPARQL Builder を開発した。本発表では、サービスの概要を示すと共に、バックグランドとなるシステムやデータ構造について紹介し、さらに今後の展開を議論する。
発表資料  pdf-i
番 号 7
タイトル RDF 化ガイドラインの提案
発表者 〇川島秀一、片山俊明、山本泰智
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  ライフサイエンス統合データベースセンター(DBCLS)では、RDF (Resource Description Framework)化された様々な生命科学データベースを統合して利用するための基盤技術開発を行っている。RDF は、Internationalized Resource Identifier (IRI)の関係を用いて、情報を表現するための方法である。RDF は計算機の可読性が高く、また、物事を表すのに、世界的にユニークなID として扱うことができるIRI を利用していることから、データの曖昧性を減らすことができる。従って、RDF は、独立して開発された複数のデータを、統合して利用するという目的を達成するには、適したデータ記述方法であると考えられている。しかし、単純にRDF 形式を採用しただけで、そのようにデータ統合に適したデータを記述することができるわけではなく、データ開発者の間で、記述に関する一定の取り決めを行うことが、第三者的に再利用性の高いRDF データを作成する上で必須であるといえる。このような観点から、DBCLS では、データベースRDF 化のガイドラインを作成してきた。このガイドラインには、IRI の設計指針、共通して提供するべき項目、共通オントロジーの利用、RDF を提供する際の指針、等が含まれる。本ガイドラインを参照してRDF を構築することで、同様にガイドラインに従ったRDF データの間で、相互運用性が非常に高くなる。本発表では、RDF ガイドラインの内容および、ガイドラインに従ったRDF データの利用法について報告したい。
発表資料  pdf-i
番 号 8
タイトル 関係データベースを効率的にRDF 化するD2RQ Mapper
発表者 〇山本泰智、片山俊明
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  生命科学分野において、多くのデータベースは依然としてMySQL やPostgreSQL などの関係データベース(RDB)に格納されていることが想定される一方で、再利用性をより高めるためにResource Description Framework (RDF)を利用してデータを表現することが近年興隆しつつある。そこでRDB の各行データをRDF として表現できれば、既存のRDB をそのままに、RDF データベースとしても利用可能にできる。これを実現するツールとしてD2RQ があるが、RDB データをRDF 化するためのルール集をD2RQ の記法に従いテキストとして記述する必要がある。我々はこのルール集を効率良く編集できるウェブアプリ、D2RQ Mapper を開発している。必要最小限のルールを自然に誤りなく記述できるサイトデザインとし、また、Docker を利用して配布することとしている。これにより、対象RDB にアクセスできるマシンに容易にD2RQ Mapper を立ち上げ、編集作業を進められる。以上のことから、D2RQ Mapper を利用することで効率的にRDB のデータをRDF として表現可能にできる。
発表資料  pdf-i
番 号 9
タイトル BioHackathon のレポートとDBCLS サービス開発の進展
発表者 〇片山俊明
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  バイオサイエンスデータベースセンターとライフサイエンス統合データベースセンター(DBCLS)では、データベースの統合に関わる最先端の技術開発を行う国際開発者会議BioHackathon を2008 年から開催してきた。第8 回となる今年は、長崎大学原爆後障害医療研究所の協力のもと長崎市内で開催し、生命科学の根幹をなすゲノム情報と関連するデータベースの統合的な利用を実現するため、セマンティック・ウェブによる最先端のデータベース技術開発を継続して行っている。この統合データベースと個人ゲノム情報や疾患情報などの解析技術を融合することにより、ゲノム医科学に資するアプリケーションの技術開発を目指している。ここでは、BioHackathonでの開発成果のサマリと、DBCLS における関連サービスの開発状況について進展を報告する。
発表資料  pdf-i
番 号 10
タイトル 表現型情報統合のためのデータ作成
発表者 〇高月照江1)、齋藤実香子1)、大島和也1)、高山英紀1)、金子裕代2)、成瀬清2)、若菜茂晴1)、
田中信彦1)、桝屋啓志1)
所 属 1)理化学研究所 バイオリソースセンター 2)自然科学研究機構 基礎生物学研究所 バイオリソース研究室
要 旨  多様な生物種で得られた研究成果を、種の違いを踏まえて統合することは生命科学の重要な課題である。我々は、遺伝因子と環境因子の相互作用によって現れる表現型と関連情報を、幅広い研究コミュニティから収集し、研究分野の垣根を超えて横断的に利活用できるようにするため、Resource Description Framework (RDF)技術を用いた分野横断的な表現型統合データベースの作成に取り組んでいる。
 RDF データの作成においては、生物種横断的に利用できる表現型のオントロジー、Phenotypic Quality Ontology (PATO)を基盤として、表現型情報を記述する生物種横断的なRDF スキーマを設計し、統合データベースとして一括検索ができることを目指している。現在、マウス(約5000 系統)、細胞(約3700 系統)、微生物(14000株)メダカ(約500 系統)について、RIKEN META DATABASE (http://metadb.riken.jp/)から公開し、さらにポータルサイトとして、J-phenome(http://jphenome.info/)の運用を開始した。
 すでに、ラット、ゼブラフィッシュ、マウスCre ドライバー系統の発現部位情報等の表現型情報のRDF データ化を進めており、順次公開予定である。表現型情報から、多様なモデル生物を、種を超えて検索できるWeb アプリケーションも開発を予定しており、これにより更なる表現型情報の利便性の向上を推進しようと考えている。
発表資料  pdf-i
番 号 11
タイトル ライフ系データの流通・統合を目指した理研メタデータベース運用の試み
発表者 〇戀津魁1)、桝屋啓志2)、小林紀郎1)
所 属 1)理化学研究所 情報基盤センター 2)理化学研究所 バイオリソースセンター
要 旨  ライフサイエンス特有の多様で複雑な研究成果データの説明や統合のためにメタデータの活用が始まっており、高度なデータ解析への応用が期待されている。理化学研究所においてもデータ産出機関としてこの潮流に乗った形で研究データの公開を進め、世界規模で研究データの活発な流通、データ統合、利用促進を図るために、理研メタデータベース(http://metadb.riken.jp/)を開発した。理研メタデータベースはメタデータ基盤の世界標準仕様であるResource Description Framework (RDF)に準じて設計された、複数のデータベースを公開できるデータベース公開基盤である。データ公開者は、RDF の知識がなくてもデータ作成ができる。具体的には、表形式データ(スプレッドシート)を利用したテンプレートにRDF リソースを入力することでデータを作成することができ、当該基盤上でRDF に変換することで世界標準の形で公開が可能となる。さらに、表形式でデータを表示するGUI(グラフィカルユーザインタフェース)が備わっており、RDF におけるグラフ・クラス・インスタンスの概念を利用し、それぞれの概念に応じた分かりやすい閲覧が可能である。グラフは個別のデータベースに対応しており、個別のデータベースについての情報の閲覧と、データベース間を横断した閲覧・検索を両立している。
発表資料  pdf-i
番 号 12
タイトル 微生物統合データベースMicrobeDB.jp の超高度化
発表者 〇森宙史1)、藤澤貴智2)、千葉啓和3)、内山郁夫3)、菅原秀明2)、中村保一2)、黒川顕1),4)、MicrobeDB.jp プロジェクトチーム1),2),3),4)
所 属 1)東京工業大学大学院 生命理工学研究科 2)情報・システム研究機構 国立遺伝学研究所 3)自然科学研究機構 基礎生物学研究所 4)東京工業大学 地球生命研究所
要 旨  微生物は発酵や抗生物質生産、感染症など様々な人間活動に深く関わっているため研究の歴史も古く、蓄積されたデータや知識は膨大かつ多様である。さらにゲノムやメタゲノムなどの大規模データも多数産出されているため、これらを横断的かつ簡便に利用出来れば、新たな仮説の創出がより容易になると期待できる。我々は、国内外に散在する細菌の各種オミックス情報を広く収集し、遺伝子、ゲノム、環境の3つの軸に沿って様々な知識を整理し、ゲノム情報を核としてセマンティックウェブ技術により統合した統合データベース「MicrobeDB.jp」をこれまで開発してきた。本研究では、MicrobeDB.jp を、細菌を超えて真菌類、藻類を対象として拡張し、統合データベースを用いた解析結果を提示するアプリケーション群の開発や利用性の向上を徹底する事で、単なる統計量の羅列ではなく、大規模データから新規知識を容易に引き出す事が可能なシステムを構築する事を目標として研究開発を行っている。
MicrobeDB.jp のウェブサイト: http://microbedb.jp/MDB/
発表資料  pdf-i
番 号 13
タイトル GenomeRefine: ゲノム・メタゲノム解析データに対してアノテーションするウェブサービス
発表者 〇藤澤貴智1)、森宙史2)、神沼英里1)、大山彰3)、菅原秀明1)、内山郁夫4)、黒川顕2),5)、中村保一1)
所 属 1)情報・システム研究機構 国立遺伝学研究所 生命情報研究センター 2)東京工業大学大学院 生命理工学研究科 3)インシリコバイオロジー株式会社 4)自然科学研究機構 基礎生物学研究所 理論生物学領域 5)東京工業大学 地球生命研究所
要 旨  MicrobeDB.jp プロジェクトでは、セマンティックウェブ技術を利用して微生物のデータベースおよびデータの統合化を進めている。新型シーケンサーの普及により、微生物ゲノム・メタゲノム解析データ量は近年増大しているが、これらの解析データをアウトプットの際、メタデータのアノテーション作業を伴う。我々は、多くのメタデータ項目とその複雑な制約をもつメタデータ入力のコストを軽減し、ゲノム・メタゲノム解析支援と非公開ゲノム情報の公開促進を目的として、ゲノムアノテーション支援ウェブサービスGenome Refine を公開している。これまでにおいて、微生物ゲノム解析パイプラインMiGAP (http://www.migap.org/) の解析結果であるゲノム情報およびメタデータを入力として、ゲノムアノテーションのためのデータベース環境と形式変換サービスを提供している。本発表においては、新規機能拡張であるメタゲノム解析パイプラインMeGAP (http://fs2.bio.titech.ac.jp/megap/) の解析データの入力拡張およびメタデータの入力インターフェース改良について報告する。また、ゲノム・メタゲノム解析データを統合的にアウトプットするためのセマンティックウェブ技術の利用についてもあわせて報告する。
発表資料  pdf-i
番 号 14
タイトル 微生物統合データベースのための微生物採取環境オントロジーと解析アプリケーションの開発
発表者 〇鈴木真也1)、山本希2)、森宙史1)、黒川顕1),2)
所 属 1)東京工業大学大学院 生命理工学研究科 2)東京工業大学 地球生命研究所
要 旨  微生物は地球上のあらゆる環境に群集を形成して存在し、多彩な機能を担うことで生態系の根幹をなしている。微生物群集の機能を解明するためにメタゲノム解析が行われ、爆発的にデータが産出されているが、環境と微生物の関係については未だに理解が十分ではない。我々はこれまでに、微生物の生息環境における情報の記述様式を、語彙集(オントロジー)を中心として整理・統一することで、微生物統合データベースMicrobeDB.jp を構築し、任意の環境におけるゲノム・メタゲノムデータを選択的に取得することを可能とした。今回我々はMicrobeDB.jpをより高度化し利便性を向上させることを目的として、メタゲノムデータに付随した、サンプル採取環境の特徴を記述するために用いられている言語表現を公共データベースから新たに収集し、これらを整理した。これにより構築されたMSV (Metagenome sample vocabulary) Ver. 0.2 を用いることで、より精密な環境情報の統合を可能とする。加えてオントロジーと対応して更新されたデータを活用するため、細菌群集の比較解析と視覚化のためのアプリケーション開発を行った。
発表資料  pdf-i
番 号 15
タイトル 疾病関連語句オントロジーを利用したゲノム、メタゲノムデータのRDF 化と利用
発表者 〇山本希1)、鈴木真也 2)、森宙史2)、黒川顕1)、MicrobeDB.jp プロジェクトチーム
所 属 1)東京工業大学 地球生命研究所 2)東京工業大学大学院 生命理工学研究科
要 旨  新型シーケンサーの普及により、ヒト疾病に関連する細菌のゲノムやメタゲノム解析が盛んに行われ、公共のデータベース(DB)に登録されている。これまでの研究で、同義語の登録や他オントロジーとの対応づけを行った疾病関連語句オントロジー(PDO)を構築し、約560 の細菌ゲノムデータとのマッピングRDF (Resource Description Framework)を作成した。これにより微生物統合DB「MicrobeDB.jp」において疾病語句によるゲノムデータ検索が可能となった。本研究ではさらに約1,500 のゲノムデータについてPDO とのマッピングを行い、検索可能データの拡充を図った。また、PDO で定義された疾病に関連する25 属の細菌について、既存の病原性関連遺伝子DB を元に、各菌株のもつ病原性遺伝子配列をまとめたDB を作成し、RDF 化した。これにより特定の疾病について、各株の系統や環境などのメタデータと病原性遺伝子の有無を同時に取得し、株間で比較することが可能となった。さらにPDO とメタゲノムデータを関連させることで、メタゲノムデータ中に存在する特定の微生物や病原遺伝子の割合を、他の疾病や健康なヒトに由来するメタゲノムデータと比較して示すことが可能になる。
発表資料  pdf-i
番 号 16
タイトル NBDC 版日化辞RDF データの公開
発表者 〇櫛田達矢1)、山田一作2)、時松敏明3)、木村考宏4)、中村伸朗4)
所 属 1)科学技術振興機構 バイオサイエンスデータベースセンター 2)野口研究所 3)情報・システム研究機構 ライフサイエンス統合データベースセンター 4)科学技術振興機構 情報企画部 情報分析室
要 旨  2015 年5 月、日化辞のResource Description Framework (RDF)データの公開を開始した。このRDF データには、オリジナルの情報検索サービスである日化辞web では提供していないInChI、InChIKey、SMILES などの化合物識別子の情報が収録され、これらをクエリーとする構造検索が可能となった。さらに主要な化合物データベース(DB)、バイオサイエンスデータベースセンターの統合化推進プログラムの成果DB、DBpedia などへのリンク情報の収録に取り組んでいる。このRDF データはPubChem、ChEMBL、ChemSpider のRDF データでも採用しているCHEMINF、SIO などのオントロジーを使用し、またライフサイエンス統合データベースセンターが中心に作成している「DB のRDF 化ガイドライン」に準拠して記述され、データの標準化を進めている。日化辞RDF データは生命科学系DB アーカイブから「CC 表示2.1 日本」のライセンスでダウンロード可能であり、J-GLOBAL knowledge でSPARQL 検索が可能である。
「DB のRDF 化ガイドライン」: http://wiki.lifesciencedb.jp/mw/RDFizingDatabaseGuideline
日化辞RDF データ(生命科学系DB アーカイブ) : https://dbarchive.biosciencedbc.jp/jp/nikkaji/desc.html
J-GLOBAL knowledge : https://stirdf.jglobal.jst.go.jp/
発表資料  pdf-i
番 号 17
タイトル 天然化合物関連情報の統合に向けた、生合成を考慮した化学構造分類とRDF 化への取り組み
発表者 〇時松敏明1)、山田一作2)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター 2)野口研究所
要 旨  植物や微生物などの生物は、幅広い構造多様性を持つ天然化合物を生合成する。これら天然化合物の中には有用な生理活性を持つ化合物が多数存在し、その情報を統合的に解析する上で、天然化合物の化学構造分類と、生合成経路、分子の性質、生理活性などと関連付けされた情報があると有用である。化合物の構造分類には、その目的によりグラフ構造に着目し構造分類を行う方法と、生合成ブロックを考慮した分類のやり方が考えられ、前者についてはすでにChEBI などで体系付けられている。しかしながら、天然物化学構造と生合成経路・遺伝子の情報を結びつける上では、後者の生合成ブロックを考慮した分類もまた必要である。そのため、我々は天然化合物の生合成を考慮した化学構造情報の整理を行うために、天然物母核データベースの整備やRDF (Resource Description Framework)化に向けた検討を行っている。
発表資料  pdf-i
番 号 18
タイトル 糖質関連化合物構造のRDF による統合化
発表者 〇山田一作1)、松原正陽1)、木下聖子2),3)、成松久3)
所 属 1)野口研究所 2)創価大学 3)産業技術総合研究所 糖鎖技術研究グループ
要 旨  我々は糖鎖関連データを統合化するために、国際糖鎖構造リポジトリ「GlyTouCan」やセマンティックウェブに対応させた糖鎖構造表記法であるWURCS (the Web3 Unique Representation of Carbohydrate Structures)を開発している。WURCS では、化合物の化学構造の内、糖鎖部分構造のみを対象とし線形文字列やResource Description Framework (RDF)などでの表記へ対応させている。さらに、WURCS における糖鎖構造表記の考え方を複合糖質など糖鎖以外の構造を含む化合物へと適用し、RDF で記述すること、糖鎖構造データと各種化合物データベースの化学構造との関連付けについて検討した。
発表資料  pdf-i
番 号 19
タイトル 炭素鎖表現の系統化に基づく単糖および糖鎖構造の包摂関係表現
発表者 〇松原正陽1)、山田一作1)、木下聖子2),3)、土屋伸一郎2)、藤田典昭3)、成松久3)
所 属 1)野口研究所 2)創価大学 3)産業技術総合研究所 糖鎖技術研究グループ
要 旨  一般に単糖はその立体異性や炭素数等を定義する慣用名や体系的名称を用いて表される。我々が開発している糖鎖構造表記法WURCS では、これらの代わりに炭素鎖の構造表記法SkeletonCode を用いる。これは炭素の立体化学や修飾情報等から定義されたアルファベットまたは数字一文字を各炭素について割り当て、その文字列によって炭素鎖の構造を表すものであり、単糖骨格を慣用表現に依らず一意に表すことができる。一方で、曖昧さを含む構造について、SkeletonCode では表すことが困難な場合がある。例えば、単にGlc と表した場合、グルコースのD 体とみなすのが一般的だが、D/L 不明を意味する場合もある。また、アノマーや直鎖/環状等の情報が無いため、アノマー位の炭素の状態は不明である。そこで、このような曖昧な状態にある炭素について、SkeletonCodeでの適切な表現方法の検討、およびそれらの情報の厳密化・系統化を行った。その結果、曖昧さを含む慣用表現に対応したSkeletonCode が記述でき、炭素情報を系統化したことで異なる曖昧さを持つSkeletonCode 間の包摂関係をも類推できるようになった。
発表資料  pdf-i
番 号 20
タイトル 糖タンパク質の位置特異的グライコフォームのデータベース
発表者 〇鹿内俊秀1)、梶裕之1)、木下聖子2)、山田一作3)、成松久1)
所 属 1)産業技術総合研究所 糖鎖技術研究グループ 2)創価大学 3)野口研究所
要 旨  産総研・糖鎖技術研究グループでは、糖鎖統合データベース(DB)のデータをより機能的に活用できるようにセマンティックウェブ化の作業を進めている。特にここ数年では、糖鎖関連遺伝子と疾患に関するデータや研究で得られる糖タンパク質の高次情報をDB 化している。今回は、網羅的に糖タンパク質上のグライコフォームの情報を解析するソフトウェアを開発したことから研究が進み、その結果得られたデータをDB 化し、自由度の高い検索を実現するためにセマンティックウェブに対応する作業を行っている。
 IGOT 法により得られた糖鎖修飾位置データに新たにグライコフォームの情報を表示させ、タンパク質名等で検索できるようにした。近い将来、組織・細胞の分化度の違いなどの糖鎖構造とタンパク質の機能との関わりを研究する方々に情報提供できるインターフェースへと発展するよう更に開発を進めている。
Acknowledgement: This research was supported by National Bioscience Database Center (NBDC)、 Japan Science and Technology Agency (JST)、 and National Institute of Advanced Industrial Science and Technology (AIST) in Japan.
発表資料  pdf-i
番 号 21
タイトル 疾患関連糖鎖オントロジーのユーザインタフェース開発
発表者 〇藤田典昭1)、ソロビヨワ・イェレナ1)、鹿内俊秀1)、木下聖子2)、成松久1)
所 属 1)産業技術総合研究所 糖鎖技術研究グループ 2)創価大学
要 旨  近年、World Wide Web 上のデータに意味を持たせ、連携を容易にする事が出来るセマンティックWeb 技術は、ライフサイエンスデータを連携するための手段としても注目されている。
 このセマンティックWeb 技術を用いることにより、オントロジーの公開、語彙の共有、関連オントロジーとの連結が可能になることから、我々は従来から開発し公開してきた糖鎖関連データベースで取扱っている情報に対してResource Description Framework (RDF)形式のオントロジーを現在開発している。
 今回、疾患に関連した2つのデータベース(GDGDB: Glyco-Disease Genes Database、PACDB: Pathogen Adherence to Carbohydrate Database)に関して開発したオントロジーに対して、オントロジーを意識せずに、利用者が必要とする情報を探すことが出来るユーザインタフェースを持つシステムの開発を行ったのでこれを報告する。本システムはhttp://acgg.asia/db/diseases からアクセスできる。
 GDGDB では、疾患の情報から関連した糖鎖遺伝子を絞り込み、糖鎖遺伝子の遺伝子座や名称等の基本情報やNCBI、UniProt へのリンク、関連する疾患の病原等の情報を見ることが出来る。またPACDB では、疾患や糖鎖から関連した病原体を絞り込み、その病原体による疾患や関連する糖鎖のモチーフ、発現の有無等の情報を見ることが出来ようにしている。
発表資料  pdf-i
番 号 22
タイトル 糖鎖関連の遺伝性疾患と感染症に関するオントロジーの開発
発表者 〇ソロビヨワ・イェレナ1)、藤田典昭1)、鹿内俊秀1)、木下聖子2)、成松久1)
所 属 1)産業技術総合研究所 糖鎖技術研究グループ 2)創価大学 理工学部
要 旨  我々は、糖鎖関連データベース(DB)の統合化を推進している。疾患に関連した2つのDB、Glyco-Disease Genes Database (GDGDB)とPathogen Adherence to Carbohydrate Database (PACDB)を構築し、2010 年から公開している。GDGDB では、糖鎖関連遺伝子の変異によって引き起こされる疾患の情報と遺伝子の情報を提供している。PACDB では、感染症を引き起こす病原体(バクテリア、ウイルス、真菌、プロトゾア)のレクチンとそのレクチンが結合する宿主(人間と動物)側の糖タンパク質や糖脂質(リガンド)の情報を提供している。そこで、利用者 に分かりやすい情報の提供を行うために、糖鎖研究者側からの視点により、疾患の症状や糖鎖の代謝に関与する酵素の欠損、レクチンや糖鎖リガンド等に関する情報の構造化と分類を行い、多様な分類を追加した。GDGDB・PACDB で提供している情報の意味的な構造(セマンティクス)及び関連領域の知識を表現するために、セマンティックWeb 技術を使用し、糖鎖関連の遺伝性疾患と感染症に関するオントロジーを構築した。本オントロジーをDB と一緒に提供することで、疾患の病因やメカニズム、症状等への理解を深めることができると考えられる。本オントロジーはhttp://acgg.asia/db/diseases/からアクセスできる。
発表資料  pdf-i
番 号 23
タイトル GlyTouCan:国際糖鎖構造リポジトリの開発
発表者 〇新町大輔1)、木下聖子1)、青木 ポール信行1)、藤田晶大1)、土屋伸一郎1)、山田一作2)、松原正陽2)、藤田典昭3)、鈴木芳典3)、ソロビヨワ・イェレナ3)、鹿内俊秀3)、奥田修二郎4)、川嵜敏祐5)、成松久3)
所 属 1)創価大学 2)野口研 3)産業技術総合研究所 4)新潟大 5)立命館大学
要 旨  近年、様々な糖鎖関連データベース(DB)は開発されてきたが、糖鎖構造(配列)を登録するためのリポジトリに相当するDB が存在しないため、これらを統一する国際リポジトリの必要性が増してきた。そこで、我々はGlyTouCan と名付けた国際糖鎖構造リポジトリを開発した。現在、GlyTouCan はversion 1.0 が公開されており、約4 万件の糖鎖構造が登録されている。新規の糖鎖構造登録の場合には、糖鎖構造の描画入力やテキスト入力により、任意のID が割り当てられる。登録された糖鎖構造に対しては、単糖や質量による絞り込み検索、描画ツールによる部分構造検索が可能である。また、GlyTouCan のデータをRDF (Resource Description Framework)化したことで、BCSDB、GlycomeDB、GlycoEpitope といった既にRDF 化されている糖鎖関連DB へのリンクもSPARQL を介して提供されている。GlyTouCan は、http://www.glytoucan.org からアクセスできる。
発表資料  pdf-i
番 号 24
タイトル 経済産業省関連ライフサイエンス・ポータルサイト MEDALS
発表者 〇福井一彦、矢葺幸光、福西快文、堀本勝久
所 属 産業技術総合研究所 創薬分子プロファイリング研究センター
要 旨  経済産業省の研究機関である産業技術総合研究所では、省庁間での生命科学系データベース(DB)の統合に向けてポータルサイトであるMEDALS の運用を行っている。本年度はクラウドへの移行に伴い、安定運用のためにシステムのアップデートを実施した。また連携事業としての便覧の更新やデータのアーカイブ化を行いバイオサイエンスデータベースセンターに提供している。加えて、これまで情報統合DB サイトとして公開してきた解析ワークフローに関するサービスをMEDALS の活動に取り入れ、インフラ整備を行い産総研内での統合化を実施している。この解析サービスではDB のRDF (Resource Description Framework)化に伴い、開発した高度な解析ツール群を広く利用可能とするために、セマンティック技術に対応したフレームワークを用い、大規模解析を可能とするサービスを目指している。
発表資料  pdf-i
番 号 25
タイトル 創薬・疾患研究への活用に向けたデータベース連携
発表者 〇坂手龍一1)、深川明子1)、水口賢司1)、山田弘1)、塩谷恭子2)、松田潤一郎1)、宮本恵宏2)、
梅垣敬三1)、小原有弘1)、松山晃文1)
所 属 1)医薬基盤・健康・栄養研究所 2)国立循環器病研究センター
要 旨  医薬基盤・健康・栄養研究所は厚生労働省の研究機関として、創薬・疾患研究をサポートする研究成果や生物資源情報のデータベース(DB)を公開している。本研究ではこれらのDB の連携による、創薬・疾患研究へのさらなる活用促進を目的としている。連携のプラットフォームとして、「創薬支援データベース統合検索」(統合検索、https://alldbs.nibiohn.go.jp)及び、連携のコアとなる「メディカル・バイオリソース・データベース」(MBRDB、https://mbrdb.nibiohn.go.jp)を構築している。統合検索では、今年度、医薬基盤研究所と統合した国立健康・栄養研究所のDB を追加するとともに、基礎研究から治験までをカバーする検索へ特化する。MBRDB では、一昨年度の疾患モデル動物情報に続き、昨年度は102 件の疫学研究情報を公開し、今年度はヒト研究資源としてバイオバンク情報を公開する。本研究により、Open TG-GATEs(トキシコゲノミクスデータベース)等との連携が発展し、新規知見の発見が促進されることが期待される。
発表資料  pdf-i
番 号 26
タイトル 創薬・疾患研究のためのデータベース検索システム Sagace & Toxygates
発表者 長尾知生子1)、五十嵐芳暢2)、〇森田瑞樹1),3)、陳怡安1)、深川明子4)、坂手龍一5)、水口賢司1)
所 属 1)医薬基盤・健康・栄養研究所 バイオインフォマティクスプロジェクト 2)同研究所 トキシコゲノミクス・インフォマティクスプロジェクト 3)岡山大学大学院 医歯薬学総合研究科 クリニカルバイオバンクネットワーキング事業化研究講座 4)医薬基盤・健康・栄養研究所 政策・倫理研究室 5)同研究所 難病資源研究室
要 旨  医薬基盤・健康・栄養研究所では、創薬・疾患研究の支援のためのデータベース(DB)を開発・公開している。本発表では、JST バイオサイエンスデータベースセンターと連携したデータベース横断検索システムSagace とトキシコゲノミクスデータ解析プラットフォームToxygates について紹介する。
 Sagace は検索対象とするDB の選定と分類、DB の分類による検索結果の絞り込み、メタデータを反映した効果的な検索結果の表示等を実装した検索システムで、創薬・疾患研究に関する情報を効率的に発見できる。現在、新規検索エンジンの検討も行なっており、より効率的な検索システムの構築を目指している。
 Toxygates はOpen TG-GATEs に収められている大規模トキシコゲノミクスデータを、よりアクセスしやすい形で収めたDB で、求める遺伝子の発現変動情報をオンデマンドで得ることができる。RDF (Resource Description Framework)化されたGO やKEGG、ChEMBL 等による遺伝子の絞り込みや、複数の遺伝子の組み合わせによる解析等も実装されている。現在は、ユーザーの手持ちの発現プロファイルデータを比較検討可能なシステムを構築中である。
発表資料  pdf-i
番 号 27
タイトル 創薬の初期研究における統合データウェアハウスTargetMine
発表者 〇陳怡安、ロケシュ テリパチ、水口賢司
所 属 医薬基盤・健康・栄養研究所 バイオインフォマティクスプロジェクト
要 旨  Effective analysis of complex biological data is a crucial goal in systems biology and drug discovery. However, it remains a challenging task and thus, bioinformatics tools and approaches that can translate voluminous biological data into actionable research are essential to new discoveries. Biological data from a single type of data source, though useful, provides only limited insights into gene and system function. Thus, integrating multiple biological data types is key to successful bioinformatics research and offers immense potential to characterise the biological processes under study. Moreover, data integration coupled with analysis and visualisation of different types of biological data are necessary to expand our understanding of biological systems for knowledge discovery. We have previously developed TargetMine, an integrated data warehouse optimised for target discovery and prioritisation of candidate genes. Here we describe new developments of TargetMine, including newer data types and data models and a new web-based interactive user interface to enhance the efficacy of TargetMine as a unified data analysis and knowledge discovery platform. TargetMine is available at http://targetmine.mizuguchilab.org.
発表資料  pdf-i
番 号 28
タイトル トキシコゲノミクスデータの統合化を目指したOpen TG-GATEs の再RDF 化について
発表者 〇五十嵐芳暢1)、伊藤真和吏2)、川島秀一3)、山田弘1)、水口賢司2)
所 属 1)医薬基盤・健康・栄養研究所 トキシコゲノミクス・インフォマティクスプロジェクト 2)同研究所 バイオインフォマティクスプロジェクト 3)情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  薬剤を暴露した動物や細胞の遺伝子発現情報とそれに付随した病理所見や血液学・生化学情報をトキシコゲノミクスデータとよぶ。トキシコゲノミクスデータを解析することによって遺伝子レベルで毒性発現メカニズムの解明や毒性予測が可能になる。
 Open TG-GATEs には170 余りの薬剤を暴露した大規模トキシコゲノミクスデータが収められている。本データベースは2012 年にRDF (Resource Description Framework)化が行われ、RDF 化されたデータはToxygatesデータベースのシステムに組み込まれている。このときメタデータ部分のRDF 化は実施されたが、発現データ部分のRDF 化は行われなかった。また文法上改良可能な部分があった。今回は、バイオサイエンスデータベースセンターのRDF 化ガイドラインに則した形で、発現データ部分を含めたトキシコゲノミクスデータの再RDF 化を進めている。さらにDrugMatrix やLINCS 等の外部のトキシコゲノミクスデータを統合することも視野に入れたRDF 化を進めることにより、毒性予測や毒性発現メカニズムを解明するためのより大規模な基盤データの構築を目指す。
発表資料  pdf-i
番 号 29
タイトル 薬剤耐性のシグネチャーKO とシグネチャーモジュール
発表者 〇田辺麻央1),2)、矢野亜津子2)、森嶋佳苗2)、金久實1),2)
所 属 1)京都大学 化学研究所 2)NPOバイオインフォマティクス・ジャパン
要 旨  Antibiotic resistance あるいはより広く Antimicrobial resistance (AMR)は、先端的な医療の実現において感染症をコントロールする際の大きな問題であるとして、米国では2013 年4 月にCDC のレポート、2014 年9 月にこれをもとにした大統領令が出され、NCBI のPathogen Detection リソース開発などが始まっている。ただ現状ではNCBI のリソースは食中毒の病原菌に限られ、多剤耐性の院内感染菌などは含まれていない。本研究では2つの観点で薬剤耐性に関する知識の集約を行っている。1 つは幅広く薬剤耐性の分子メカニズムに関する知識をKEGG モジュールとしてデータベース化すること、もう1 つはCDC がThreat levels として分類している緊急性の高い薬剤耐性菌をゲノムのシークエンスデータから判別するためのリソース作りである。後者では薬剤耐性遺伝子の変異をシグネチャーKO(KEGG Orthology)で、遺伝子セットをシグネチャーモジュールで表現している。実際に病原体ゲノムを調べるPathogen Checker ツールの開発も行っている。
発表資料  pdf-i
番 号 30
タイトル 医薬品階層に基づく医薬品相互作用ネットワーク解析
発表者 〇米納朋子1),3)、石黒真理2),3)、永吉ふみ3)、金久實1),3)
所 属 1)京都大学 化学研究所 2)東京大学 医科学研究所 ヒトゲノム解析センター 3)NPOバイオインフォマティクス・ジャパン
要 旨  KEGG MEDICUSでは医薬品に関する科学的知識を蓄積したKEGG DRUGと、JAPICより提供を受けている医薬品添付文書が統合されている。これまではKEGGのD番号、対応する添付文書のJAPIC ID、各添付文書に含まれる商品のIDの3つの階層を扱う形で検索システムや閲覧ページを作成してきた。昨年度に開発を開始したKEGG DGROUPデータベースではD番号より上の階層として、とくに医薬品相互作用ネットワークにおける同一あるいは類似の機能(効能・効果、作用・副作用など)を表現したグループを定義することとした。また医療現場や一般社会での使いやすさのために、商品のYJコードとD番号が直結した形にし、添付文書は各商品の詳細情報とした。さらに代表的な疾患の治療薬について、商品を医薬品クラスの概念(その一部はDGROUPとして定義)で分類し、添付文書に記載された適応症や適応菌種の情報とともに、BRITEテーブルファイルの作成を行っている。これらを用いてすでに公開している医薬品相互作用チェックツールの高度化を行い、独自の参考情報としてCYP遺伝子多型による影響なども追加する予定である。
発表資料  pdf-i
番 号 31
タイトル HLA 遺伝子完全配列決定パイプラインの構築
発表者 〇早野崇英1)、細道一善2)、井ノ上逸朗1)
所 属 1)情報・システム研究機構 国立遺伝学研究所 2)金沢大学 医薬保健研究域医学系
要 旨  HLA はヒト主要組織適合抗原であり、HLA 遺伝子領域(6p21.3)はヒトゲノムの中でも非常に多型性に富む領域である。HLA ハプロタイプは、薬剤副作用や骨髄移植・臓器移植時の拒絶反応との関連性が高い。また、リウマチや糖尿病などの生活習慣病、自己免疫疾患、がん、ウイルス感染症における防御もしくは重症化など100 近くの疾患との関連が報告されている。HLA 遺伝子完全配列決定は、HLA 遺伝子領域の多型性のため困難であった。我々はNGS を使用したHLA 遺伝子完全配列決定パイプラインの構築を試みた。Tagmentation によるライブラリー調整後、キャプチャー法にてHLA 関連遺伝子配列を濃縮し、MiSeq で配列決定する。このパイプラインには、新たに開発したライブラリーサイズとモル濃度を均一化する手法(BeNUS)や一塩基置換(SNV)の情報を利用しHLA ハプロタイプを決定するプログラムが含まれている。得られたHLA 遺伝子完全配列情報は、ヒトゲノムバリエーションデータベースのHLA-DB に順次格納していく。今後も、このパイプラインを用いることでHLA-DB を拡充していき医療への応用へとつなげていく。
発表資料  pdf-i
番 号 32
タイトル ヒトゲノム変異情報のRDF化
発表者 〇河野信1)、山下理宇2)、込山悠介3)、鈴木絢子4),5)、鈴木穣4)、菅野純夫3)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター 2)東北メディカルメガバンク機構 3)東京大学 医科学研究所 4)東京大学大学院 新領域創成科学研究科 5)国立がん研究センター 先端医療開発センター
要 旨  変異の情報は最終的にVCF (Variation Call Format)形式で提供されることが多いが、横断的に検索する用途には向いていない。そこで、VCF の変異情報をより横断的・統合的に検索することが可能なRDF (Resource Description Framework)形式に変換するためのプログラムを開発した。ENSEMBL で開発された変異データを表現するオントロジーならびにGFVO (Genomic Feature and Variation Ontology)を基本として、不足しているオントロジーを独自に設計した。また、変異部位の座標を指定するためにFALDO (Feature Annotation Location Description Ontology)を用いた。
 ここでは、DBTSS で提供されている肺腺がんモデル細胞のデータをRDF 化した。約350 万の変異情報を持つLC2/ad 株のデータから、約1.5 億のトリプルが生成された。作成したオントロジーやプログラムは https://github.com/orenogithub/BH14.14 で公開している。
発表資料  pdf-i
番 号 33
タイトル バイオサイエンスデータベースセンター(NBDC)ヒトデータベースの運用報告
発表者 〇川嶋実苗、三橋信孝、宮崎和典、箕輪真理
所 属 科学技術振興機構 バイオサイエンスデータベースセンター
要 旨  ここ1-2年、『オープンジャーナル』『オープンデータ』『オープンリポジトリ』という言葉を頻繁に耳にするようになり、生命科学・生物医学・環境科学分野を中心に論文のオープンアクセス化や、論文に使用したデータの研究者間での共有化が積極的に進められてきた。倫理面の配慮が必要なヒトから採取した試料から産出したデータ(ヒトデータ)についても例外ではなく、米国NCBI のdbGAP や欧州EBI-EMBL のEuropean Genome-phenome Archive (EGA)といった公的データベースを通じて世界中の研究者間でヒトデータの研究データの共有化が進められている。日本でも、DNA Data Bank of Japan (DDBJ)と協力体制の下、ヒトデータを共有するためのプラットフォーム『NBDC ヒトデータベース』の運用を開始してから2 年が経った。この2 年間のデータ共有状況を報告するとともに、データ提供・利用法に関する相談を受け付けることで、より使いやすいデータベースの構築を目指すとともに、データの利活用のヒントとしていきたい。
発表資料  pdf-i
番 号 34
タイトル NGS データ利活用促進のための公共データベースの役割
発表者 〇仲里猛留、大田達郎、坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  NGS(次世代シーケンサー、新型シーケンサーともいう)を用いてゲノム解読や発現解析、メタゲノムやSNP 解析が盛んに行われるようになって久しいが、最近はNGS データの公共データベースであるSRA (Sequence Read Archive)からデータを得て、自身のデータと合わせ解析を行うケースも徐々に増えてきた。ライフサイエンス統合データベースセンター(DBCLS)では、SRA に収載された公共NGS データをさらに利活用できるようにするためDBCLS SRA (http://sra.dbcls.jp/)をリリースし、目的別や機器別といった切り口から検索をしやすくできるようにしている。NGS の応用分野の一つである医学関係に関しては、疾患名や文献からの検索を行えるようにしてある。またいわゆる非モデル生物に関しては、例えばイネ(Oryza sativa)だけでなくその下位概念にあたる品種等も一度に検索できたり、逆に上位概念であるOryza 属全体の検索をすぐに行えるようにするなど、生物種からの検索を機能強化している。今回は、DBCLS 等での他の取り組みとの連携も含めつつ、今後のNGS データの利活用場面について紹介する。
発表資料  pdf-i
番 号 35
タイトル 公共遺伝子発現データを活用するためのツールRefEx とAOE
発表者 小野浩雅、〇坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  ライフサイエンス統合データベースセンターでは、遺伝子発現データの再利用を促進し、知のめぐりをよくするツールを開発してきた。
 RefEx (Reference Expression dataset; http://refex.dbcls.jp/)は、ヒト、マウスおよびラットの正常組織を対象にしたリファレンスデータセットで、4 つの異なる実験手法(EST、GeneChip、CAGE、RNA-seq)によって得られた遺伝子発現量を並列に表現することで各遺伝子の発現量を直感的に比較できる。また、最近、初代培養細胞、臓器、あるいは数多くの細胞株における大規模なヒトおよびマウスのCAGE データ(RIKEN FANTOM5)を追加した。
 AOE (All Of gene Expression; http://aoe.dbcls.jp/)は、公共遺伝子発現データベースの目次で、ヒストグラムからデータを選択、項目を選択してリスト表示、生物種ごとや手法ごとのデータ数の登録データランキングでより探しやすくなっている。
 これらの遺伝子発現データリソースを紹介し、いくつかの使用実例を示す。
発表資料  pdf-i
番 号 36
タイトル 既報のChIP-seq データをフル活用するための統合データベース
発表者 〇沖真弥1)、大田達郎2)、塩井剛3)、仲木竜4)、目野主税1)
所 属 1)九州大学大学院 医学研究院 発生再生医学分野 2)情報・システム研究機構 ライフサイエンス統合データベースセンター 3)理化学研究所 ライフサイエンス技術基盤研究センター 4)東京大学 先端科学技術研究センター
要 旨  論文などで報告された全てのChIP-seq データを全て計算処理し、どのタンパク質がどのゲノム領域に結合しているかを簡単に可視化できるような統合データベースを作成した。これにより、興味の遺伝子の周辺に結合する転写因子をゲノムブラウザで視覚的に理解でき、さらにはシス調節領域の予測が可能になる。また全てのChIP-seq データを統合的かつ横断的に解析し、転写因子と被制御遺伝子の関係について網羅的な対応付けをおこなった。これにより、ユーザが興味のある転写因子をウェブ上で選ぶだけで、その共局在性パートナー因子や標的遺伝子を知ることができる。
 さらに、ユーザデータを本データベースと照合して解析するためのサービスを設置する予定である。ユーザによるChIP-seq 実験で得られたピークデータをサブミットすることにより、類似パターンを示す既報のChIP-seq実験が返される。またユーザによる発現解析実験で得られた遺伝子リストをサブミットすれば、それらをまとめて制御する転写因子が返されるようなプラットフォームを構築している。
発表資料  pdf-i
番 号 37
タイトル 軽量仮想環境による再現性を担保したデータ解析ワークフローの構築とその共有
発表者 〇大田達郎1)、小笠原理2)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター 2)情報・システム研究機構 国立遺伝学研究所 DDBJ センター
要 旨  生命科学分野における大規模塩基配列データを利用した研究の拡大に伴って、大量データの解析の効率化が求められている。また、論文公開に伴う配列データの公開は普及しつつあるが、結果を得るためのデータ解析フローの情報は論文中で言及されるに留まっており完全ではないため、オープンサイエンスの妨げとなっている。ライフサイエンス統合データベースセンターとDDBJ センターでは、情報学研究所や統計数理研究所とも協力し、通常複数のソフトウェアを組み合わせて構築される塩基配列解析ワークフローの管理、実行、再実行を、異なる複数の大型計算機で簡易に行うための情報技術の研究開発を行っている。本ポスター発表では、コンテナ型仮想と呼ばれる軽量仮想環境を利用して、データ解析環境の可搬性を高め、異なる計算機環境での実行を可能にすることにより、データ解析の再現性を担保する取り組みを紹介する。
発表資料  pdf-i
番 号 38
タイトル タンパク質-リガンド間の高精度全電子計算の実行を支援するPyMOL プラグイン、PaicsPy の開発
発表者 〇中野祥吾1)、常盤恭樹2)、舘野浩章3)、岸本直樹2)、伊藤創平1)、常盤広明4)、平林淳3)
所 属 1)静岡県立大学 食品栄養科学部 食品生命科学科 2)東北大学大学院 理学研究科 3)産業技術総合研究所 創薬基盤研究部門 4)立教大学 理学部 化学科
要 旨  レクチン-糖鎖間の結合など、タンパク質とリガンド間の相互作用を正確に見積もることは、酵素工学や創薬の分野で重要な課題の一つとなっている。本研究では、タンパク質-リガンド間の全電子計算が可能なフラグメント分子軌道法 (FMO) 用ソフトウェア、Paics[1] の実行を支援するPyMOL プラグイン、PaicsPy の開発状況について発表する。PaicsPy は、Paics の入力ファイルを作成するためのプラグイン“PaicsPy_input”とPaics の出力結果を可視化するためのプラグン“PaicsPy_output”の2 つから構成されている。
 PaicsPy_input に関して、タンパク質分子をPaics の入力形式に自動変換するプラグインの開発を完了した。モデルタンパク質を用いた計算結果から、入力ファイルが正しく作られていることを確認した。今後は、糖鎖やリガンドを手動でフラグメント化するための機能を追加する予定である。
 PaicsPy_output に関して、残基間相互作用 (IFIEs) の値をタンパク質構造に反映したモデルを、PyMOL 上で可視化することを完了した。タンパク質-タンパク質間とタンパク質-リガンド間のIFIEs の可視化が可能となっている。現在はユーザビリティの向上のため、PaicsPy_output のプラグイン開発を進めている。
【参考文献】
[1] Ishikawa, T. & Kuwata, K. Fragment molecular orbital calculation using the RI-MP2 method. Chem. Phys. Lett. 474, 195–198 (2009).
発表資料  pdf-i
番 号 39
タイトル GGRNA/GGGenome:塩基配列データベースをすばやく検索するウェブツール
発表者 〇内藤雄樹
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  GGRNA (http://GGRNA.dbcls.jp/)は、塩基配列データベースをGoogle のように検索できるウェブツールである。検索キーワードとして、遺伝子名や各種のID などあらゆる語句を単一の検索窓に入力するだけで遺伝子や転写産物をすばやく探すことができる。また、塩基配列の検索については、ミスマッチやギャップを含む塩基配列の検索を、転写産物だけでなくゲノムに対しても行うことができるウェブツールGGGenome (http://GGGenome.dbcls.jp/)を開発し、GGRNA と連携させている。本年のアップデートにより、これらのウェブツールではNCBI RefSeq に登録された全生物種のmRNA および非コードRNA、さらには、国際塩基配列データベース(INSD)に登録された全ての情報を一度に検索することができるようになった。さらにGGGenome では、UCSC に登録された100 以上の生物種のゲノム配列が検索可能となった。GGRNA およびGGGenome のすべての機能は無償で自由に利用でき、REST API により他のデータベースやソフトウェアとも容易に連携できる。
発表資料  pdf-i
番 号 40
タイトル 配合生薬の横断検索のためのスマートフォン向けアプリケーションの開発
発表者 〇桂樹哲雄1)、Sony H. Wijaya2)、金谷重彦2)、高橋由雅1)
所 属 1)豊橋技術科学大学大学院 工学研究科 2)奈良先端科学技術大学院大学 情報科学研究科
要 旨  日本の漢方、インドネシアのジャムゥ、中国の伝統的中国医薬などの、地域に根付いた伝統的配合生薬は世界各地で報告されている。これらの配合生薬の情報は、現在一部を除き文献ベースである。しかしながら、近年伝統的配合生薬を医療の一部として利用しようという機運が高まってきていることから、これらの情報は今後デジタル化され、データベースとして利用できるようになることが見込まれる。
 本研究では、これらのデータベース開発に先立ち、配合生薬と効能の情報を横断的に検索するためのスマートフォン向けアプリケーションと、そのデータ基盤を開発した。このアプリケーションは、配合生薬データをプラグインとして導入することで、様々な種類の配合生薬システムの情報を検索対象として追加できるように設計された。これにより、ユーザは世界各地の配合生薬のデータ、あるいはユーザ独自のデータを追加し、それらに基づいて、含まれる配合生薬のレシピとその効能を横断的に検索することができる。開発したアプリケーションにより、様々な種類の伝統的配合生薬の知見を健康維持や、創薬の現場で役立てることができると期待される。
発表資料  pdf-i
番 号 41
タイトル 代謝物リストの見本を載せるデータベースの開発
発表者 〇有田正規1),2)、金谷重彦3)、櫻井望4)
所 属 1)理化学研究所 環境資源科学研究センター 2)情報・システム研究機構 国立遺伝学研究所 3)奈良先端科学技術大学院大学 4)かずさDNA研究所
要 旨  データ洪水時代に入り、ゲノムだけでなくプロテオームやメタボロームのデータもウェブからダウンロードできる時代になりました。しかしデータの精度や信憑性を判断するのは研究者にとっても難しい作業であり、環境によって変化しうるメタボロームはとりわけ扱いにくい対象です。本事業では、シロイヌナズナや酵母のようにモデルと呼ばれる代表的生物種について、第一線の研究施設で計測されるメタボローム情報と過去の文献情報を統合します。そして見本またはリファレンスとして機能する代謝物リスト(モデルメタボローム)のデータベースを作成します。具体的には代謝物を計測する理化学研究所、かずさDNA 研究所の測定データと奈良先端大の文献データベースをもとに見本データを構築します。また国外の研究グループとの連携をするためのソフトウェアも構築します。
発表資料  pdf-i
番 号 42
タイトル 生体高分子NMRデータベース(BioMagResBank)の統合化とその応用
発表者 〇小林直宏、横地政史、岩田武史、児嶋長次郎、藤原敏道
所 属 大阪大学 蛋白質研究所
要 旨  核磁気共鳴法(NMR)は創薬研究に直結する重要なパラメータである化学シフトやタンパク質の動的な情報を得ることが出来る研究方法である。我々PDBj-BMRB グループは生体高分子のNMR実験データの国際的なデータベース(DB)であるBioMagResBank(BMRB)の全データをオントロジーに基づいてXML 化、RDF (Resource Description Framework)化して公開した。更にRDF 検索のためのSPARQL エンドポイントを公開することで他の生命科学系DB との統合的な検索が可能になった。本年度においてはSPARQL 検索の応用としてBMRB、PDB、UniProt、IntAct をモデル構造DB であるSAHG と連携させることでNMR データに対して構造座標、機能情報、一塩基置換情報、疾患関連情報およびタンパク質間相互作用情報を一括して検索できる2次DB を構築した。またXML 化されたBMRB、PDB、UniProt などのDB を統合的にかつ高速に検索することが可能なWeb サイトのプロトタイプを開発した。これらの2次DB やWeb サイトを公開することによりNMR 創薬研究への有効活用が期待される。
発表資料  pdf-i
番 号 43
タイトル 蛋白質構造データバンク(PDBj)の高度化と統合的運用
発表者 〇金城玲1)、中川敦史1)、猿渡茂2)、鈴木博文1)、中村春木1)
所 属 1)大阪大学 蛋白質研究所 2)北里大学 理学部
要 旨  タンパク質、核酸、糖鎖などの生体高分子の立体構造情報はProtein Data Bank (PDB)として集積され、2015年7 月には11 万件を超える構造データを蓄積している。PDBj は、国際的組織であるwwPDB の一員として、共通した品質管理によるデータ登録作業とダウンロード・サイトの運営および独自のサービス・ツールや二次データベース(DB)の提供、セマンティック化を実施している[1]。
 これまで、データ登録の高度化(データ検証の改良と検証レポートの公開・配布、新たなPDBx/mmCIF フォーマットの利用の促進)と配布を継続的に実施してきた。新たに、リガンド・蛋白質複合体解析による医薬スクリーニングデータの精密化支援、異なる階層のデータと蛋白質構造情報との統合化のための蛋白質複合体に対する多面的解析ツール・サービス(分子表面DB、基準振動による蛋白質ダイナミクスDB、PDB とEMDB の双方に対する構造形状の同時比較・検索等)の開発・公開を行った。
【参考文献】
[1] Kinjo A. R. et al.、 Nucl. Acids Res. 40、 D453-D460、 2012
発表資料  pdf-i
番 号 44
タイトル jPOST (Japan Proteome Standard Repository/Database):プロテオーム・データの標準化と統合
発表者 〇守屋勇樹1)、河野信1)、奥田修二郎2)、山本格3)、松本雅記4)、小林大樹5)、荒木令江5)、吉沢明康6)、五斗進6)、田畑剛7)、杉山直幸7)、石濱泰7)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター 2)新潟大学大学院 医歯学総合研究科 3)新潟大学 産学地域連携推進機構 4)九州大学 生体防御医学研究所 5)熊本大学大学院 生命科学研究部 6)京都大学 化学研究所 バイオインフォマティクスセンター 7)京都大学大学院 薬学研究科
要 旨  オミックス・データの集積・統合は広く行われているが、プロジェクトや研究機関の枠を超えてこれらのデータを統合するためにはデータの適切な標準化が必要である。今回我々は、プロテオーム・データをこのような標準化プロセスの下に集積したデータベースjPOST の構築を開始した。
 jPOST はリポジトリ、標準化プロセス、Cube、Globe、Slice の各要素から成る。
 プロテオーム分野では、論文を投稿する際に生データをリポジトリへ登録することが義務付けられており、これに対応できる国際的なID 発行機関であるProteomeXchange と連携したリポジトリを構築する。また、これら生データからjPOST 基準を満たすデータを選別し、独自構築したデータ解析ワークフロー(ピーク検出、タンパク質同定、定量)に従って再解析した結果を、解析単位毎にCube に格納する。これらのCube を全て統合した核がGlobe である。これには、各データの解析手法、スコアなど多数の関連情報が紐付いており、これらを用いて検索抽出した結果を、Slice インターフェースによって提示する。現在、リポジトリの実装、標準化プロセスの策定、全体構成の設計が進行中である。
発表資料  pdf-i
番 号 45
タイトル SSBD:生命動態情報と細胞・発生画像情報の統合データベース
発表者 〇遠里由佳子、ホー ケネス、京田耕司、大浪修一
所 属 理化学研究所 生命システム研究センター 発生動態研究チーム
要 旨  顕微鏡計測と画像処理技術の発展により、分子や細胞、組織、個体などの多様な生命現象の動態を動画像として記録し、時空間情報を数値として含む定量データとして計測することが可能になった。そこで我々は、これら定量データの再利用性の向上をめざし、生命動態システム科学の統合データベースSSBD (Systems Science of Biological Dynamics; http://ssbd.qbic.riken.jp )を構築してきた。そして2015 年4 月より、我が国の細胞生物学および発生生物学の画像情報と生命動態情報との有機的な連携をめざして、定量化が求められる動画像の収集を開始している。SSBD において、定量データは、BDML (Biological Dynamics Markup Language)で統一的に記述される。動画像は、顕微鏡管理システムであるOMERO により管理・共有される。BDML やOMERO に関するソフトウェアツールも入手できる。本ポスターでは、定量データおよび動画像に付与されているメタ情報のRDF (Resource Description Framework)化についての報告と、今後の展望について紹介する。
発表資料  pdf-i
番 号 46
タイトル BDML:生命現象の時空間動態に対する定量データを記述する言語
発表者 〇京田耕司、遠里由佳子、ホー ケネス、大浪修一
所 属 理化学研究所 生命システム研究センター 発生動態研究チーム
要 旨  生細胞イメージングやモデリング技術の発展に伴い、生命現象の時空間動態に対する定量データが、画像処理やシミュレーションを介して大量に産出されている。今までに、多くの研究グループから、さまざまな生命現象に対する定量データとそれらに対応するツールが公開されてきたが、これらの定量データとツールは、各研究グループで独自のデータ形式を採用しているため互換性がなく、再利用が困難であるという問題があった。そこで我々は、さまざまな生命現象の時空間動態を統一的に記述するための言語、Biological Dynamics Markup Language (BDML)を開発した。BDML はXML を基盤としており、その可読性の高さはデータの共有、各種ツール群の開発を容易にし、また拡張性の高さは将来の新しいタイプのデータへの柔軟な対応を可能にする。現在のBDML version 0.2 では、分子、細胞から個体レベルの動態に至る多種多様な定量データが記述可能であり、それらのメタデータをRDF (Resource Description Framework)/オントロジーで記述可能である。さらに我々は、BDML で記述されたデータに対応した可視化・解析ツールの開発を進めている。
発表資料  pdf-i
番 号 47
タイトル 遺伝子オルソログDB による植物ゲノムDB の統合
発表者 〇中谷明弘1)、菊地正隆1)、市原寿子2)、白澤沙知子2)、浅水恵理香3)、平川英樹2)、中村保一2)、
田畑哲之2)
所 属 1)大阪大学大学院 医学系研究科 2)かずさDNA研究所 3)龍谷大学 農学部
要 旨  配列の類似したアミノ酸配列(遺伝子)の種間の対応関係をオルソログと定義し、緑色植物とラン藻のオルソログ情報を蓄積したデータベース(DB)を構築しています。構築したDB は、PGDBj(Plant Genome DataBase Japan;http://pgdbj.jp)からオルソログDB として公開しています。さまざまなゲノムDB をこのオルソログDB に配列類似性に基づいてリンクすることによって、エントリーレベルでのDB 統合が可能になります。また、オルソログ関係にある遺伝子の染色体上での位置情報に基づいて種間で対応関係にある染色体の部分領域(シンテニー様領域)の情報を抽出することにより、各部分領域に含まれる遺伝子やマーカーのDNA 配列上での位置的な対応関係の推定や探索もDB 検索によって可能になります。これまでに、NCBI RefSeq (Release 66)から取得した緑色植物のアミノ酸配列(40 種・約100 万配列)とラン藻のアミノ酸配列(213 種・約80 万配列)を対象として、両系統群内での全アミノ酸配列間のBLAST による配列相同性の算出、および、それに基づいた全アミノ酸配列の分類を行い、オルソログ情報の生成およびDB 化を完了しています。
発表資料  pdf-i
番 号 48
タイトル 植物ゲノム情報活用のための統合研究基盤の構築
発表者 〇市原寿子1)、白澤沙知子1)、中村保一1)、中谷明弘2)、菊地正隆2)、浅水恵理香3)、平川英樹1)、
田畑哲之1)
所 属 1)かずさDNA研究所 2)大阪大学大学院 医学系研究科 3)龍谷大学 農学部
要 旨  我々は、散在する多様な植物ゲノム関連情報を整備した情報基盤として、ポータルサイトPlant Genome DataBase Japan (PGDBj、http://pgdbj.jp)を提供し、ユーザが必要とするデータアクセスの利便性向上を目指しています。現在、PGDBj のデータベース(DB)の内、リソースDB では、理化学研究所バイオリソースセンター(BRC)が開発した植物遺伝子の串刺し検索システムSABRE2 (http://sabre.epd.brc.riken.jp/SABRE2.html)を拡充し、BRC およびナショナルバイオリソースプロジェクトから提供されている14 生物種の計1,504,022 件のリソース情報に加え、PGDBj で整備した情報も横断検索出来るようにシステムを開発し、公開しています。整備した情報には、近畿大学と果樹研究所で維持されているカンキツ類の約900 個体分の在来種および栽培品種の保存株情報や、オランダイチゴの計660,323 遺伝子ならびにカーネーションの43,266 遺伝子の配列情報が含まれます。また、DNA マーカーDB では、39 生物種の計101,742 件のマーカー情報と24 生物種の遺伝地図情報、11 生物種の物理地図情報を公開しています。
発表資料  pdf-i
番 号 49
タイトル 農学系ゲノム研究解析支援システムGalaxy/NIAS の運用
発表者 〇田中剛1)、伊藤龍太郎1),2)、伊藤剛1)
所 属 1)農業生物資源研究所 2)株式会社ダイナコム
要 旨  生命科学系の技術革新は目覚ましく、特に高速シーケンサー(NGS)の生産するデータ量は極めて膨大であることから、大量情報解析が研究者の大きな負担になっている。農畜産物のゲノム研究においても大規模なDNA マーカー開発などが必須になってきており、誰もがNGS の大量情報を高速に処理して研究推進出来る体制が望まれている。そこで我々は、農林水産省の委託プロジェクト研究「画期的な農畜産物作出のためのゲノム情報データベースの整備」の一環として、ウェブのGUI(グラフィカルユーザインターフェース)を通してNGS などの大規模データを処理する枠組みであるGalaxy を採用し、Galaxy/NIAS として2014 年より公開、運用している(https://galaxy.dna.affrc.go.jp/)。これまでに、NGS データ解析では不可欠な大型ファイルのアップロード機能構築や、バックアップ用大型ストレージ利用のためのシステム構築を行ってきた。また、これまでに受けた様々な解析支援依頼の経験から、農学系で要望の多い解析について独自のワークフローを作成し、公開している。加えて、JBrowse でのデータの可視化機能等も追加するなど、非情報解析系の研究者にとって使い勝手の良いサービスを目指している。本システムは、農畜産物ゲノム情報データベースAgrID(http://agrid.dna.affrc.go.jp/)の一部として公開している。
発表資料  pdf-i
番 号 50
タイトル DDBJ: Status 2015
発表者 〇中村保一、神沼英里、小笠原理、有田正規、大久保公策、高木利久
所 属 情報・システム研究機構 国立遺伝学研究所 DDBJ センター
要 旨  DDBJ (http://www.ddbj.nig.ac.jp)はNCBI、EBI とともにInternational Nucleotide Sequence Database Collaboration (INSDC)を構成し塩基配列アーカイブと解析リソース、遺伝研スーパーコンピュータの管理等の塩基配列まわりのデータならびに解析系の提供を運営している。INSDC では伝統的な配列データベース(DB)(Traditional INSDC) を中心に、新型シーケンサ由来データDB のDDBJ Sequence Read Archive (DRA)や、研究プロジェクトに関するBioProject DB、サンプルに関するBioSample DB、NBDC と共同で制限アクセスを備えたヒト対象の表現型/遺伝子型解析データアーカイブであるJapanese Genotype-phenotype Archive (JGA)を運営している。今年度のDDBJ の運営についての進捗と展望を報告する。
発表資料  pdf-i
番 号 51
タイトル 大規模比較解析に向けた微生物ゲノムデータベースMBGDの拡張
発表者 〇内山郁夫1)、三原基広2)、西出浩世1)、千葉啓和1)
所 属 1)自然科学研究機構 基礎生物学研究所 2)株式会社ダイナコム
要 旨  MBGD (http://mbgd.genome.ad.jp/)は、公開された微生物のゲノム情報を、オーソログ関係に基づいて整理し比較するためのデータベースである。全系統をカバーする「標準オーソログ表」に加えて、近縁ゲノム比較に向けた系統群ごとのオーソログ表も作成している。現在公開されている微生物ゲノムは、完全ゲノムで数千件、ドラフトゲノムを加えると数万件に及んでおり、さらに拡大を続けている。MBGDはこれらを効果的に活用できるよう、データベースの拡張を行うとともに、さらなる効率的なデータ処理方法の開発を行っている。データの取り込みは、NCBIのAssembly Reportsのデータを用いて完全ゲノムとドラフトゲノムの振り分けを行い、完全ゲノム、および「属」レベルで完全ゲノムに含まれないドラフトゲノムについては、総当たりホモロジー検索を行って、オーソログテーブルを作成している。それ以外のドラフトゲノムは、MyMBGD機能を用いて、完全ゲノムと合わせたオーソログ解析を動的に行うことができる。一方、近年同一種のゲノムを多数決めて比較する研究が増えてきたことから,種内比較と種間比較を分けて効率的にデータを管理するよう、改良を進めている。
発表資料  pdf-i
番 号 52
タイトル セマンティックWeb技術を用いたオーソログデータベースの統合化
発表者 〇千葉啓和、西出浩世、内山郁夫
所 属 自然科学研究機構 基礎生物学研究所
要 旨  我々は、オーソログデータベースに対してセマンティックWeb技術を適用し、ゲノムデータと様々な情報を統合するための基盤となるシステムを開発した。我々はまず、オーソログデータをRDF (Resource Description Framework)で表現するために、オーソログオントロジーOrthOを構築した。OrthOは、オーソログデータベース一般に適用可能な汎用的なオントロジーであるが、データベース固有の概念を表現するために拡張することも可能になっている。我々は、OrthOを用いて、微生物比較ゲノムデータベースMBGDをRDF化した。さらに、SPARQLエンドポイントを公開して、それらのRDFに対する検索を可能にした。これらによって、他のデータベースと連結させ、オーソログ情報をハブとして異なる生物のデータを統合的に利用することが容易になっている。また、OrthOの枠組みを用いて、異なるオーソログデータベースを表現することで、それらを相互に比較することができる。本発表では、我々の開発したシステムがゲノムデータの統合的解析に役立つ例を示す。
発表資料  pdf-i
番 号 53
タイトル Global Alliance for Genomics and Health(GA4GH)全体会議(第3回)参加報告
発表者 〇箕輪真理1),2)、片山俊明2)、川嶋実苗1)、河野信1),2)、三橋信孝1)
所 属 1)科学技術振興機構 バイオサイエンスデータベースセンター 2)情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  ヒトのゲノム(主としてNGS)データや臨床情報等のセンシティブな情報を国際間で共有することにより医学の発展への貢献を目指して2013年1月に設立されたGlobal Alliance for Genomics and Health(GA4GH)の第3回の全体ミーティングが本年6月に開催された。この活動への参加機関(世界34か国から341機関)には、NBDCヒトデータベースの運用機関であるバイオサイエンスデータベースセンター(NBDC)および遺伝研DDBJセンター、今後ヒトに関するデータの統合化を実践的に推進していくライフサイエンス統合データベースセンター(DBCLS)をはじめ、日本からの11機関が含まれる。今回の全体会議にはNBDC、DBCLSから5名が参加、1) Clinical、2) Data、3) Regulatory and Ethics、4) Securityのワーキンググループやパイロット的に実施されている各プロジェクト等の情報収集を幅広く行った。その内容をご報告するとともに、今後の我々のデータベース統合の活動にどう生かしていくかについて検討したい。
GA4GHウェブサイト:http://genomicsandhealth.org/
発表資料  pdf-i