ポスター発表は
【奇数番号】11:25 ~ 12:35 (説明時間11:30 ~ 12:30)
【偶数番号】15:05 ~ 16:15 (説明時間15:10 ~ 16:10)
を予定しております。
発表者はこちら(ポスター様式、ポスター設置・撤去などのタイムスケジュール等)をご覧ください。


※ポスターや発表スライド等の著作権は、別途記載がない限り発表者・発表者の所属機関に帰属します。
 ポスター・スライド内の図や文言を転用する際には、著作者と話し合っていただくようお願いいたします。
番号  代表発表者所 属タイトル 発表資料
1  大波純一 科学技術振興機構 バイオサイエンスデータベースセンター 情報探索と俯瞰をアシストする生命科学データベース横断検索 pdf-i
2  信定知江 科学技術振興機構 バイオサイエンスデータベースセンター データベースの再利用・再構築と生命科学系データベースアーカイブ pdf-i
3  飯田啓介 情報・システム研究機構 ライフサイエンス統合データベースセンター 新しい日本語Webコンテンツ、「新着論文レビュー」と「領域融合レビュー」 pdf-i
4  山口敦子 情報・システム研究機構 ライフサイエンス統合データベースセンター 分散環境におけるRDF基盤構築技術の研究開発 pdf-i
5  片山俊明 情報・システム研究機構 ライフサイエンス統合データベースセンター RDFによるデータ統合と相互運用性のための技術開発 pdf-i
6  川島秀一 情報・システム研究機構 ライフサイエンス統合データベースセンター TogoGenome / TogoStanza の新規機能開発
7  山本泰智 情報・システム研究機構 ライフサイエンス統合データベースセンター 日本語コンテンツに対するセマンティックウェブ技術の適用 pdf-i
8  高月照江 理化学研究所 バイオリソースセンター 表現型情報でつなぐフェノーム統合データベース pdf-i
9  藤澤貴智 情報・システム研究機構 国立遺伝学研究所 生命情報研究センター  Genome Refine: ゲノムアノテーション支援ウェブサービスにおけるセマンティックウェブ技術の利用
10  山本希 東京工業大学 地球生命研究所 微生物の生息環境を記述するオントロジーの拡張とMicrobeDB.jpでの利用
11  黒川顕 東京工業大学 微生物統合データベース MicrobeDB.jpの超高度化
12  櫛田達矢 科学技術振興機構 バイオサイエンスデータベースセンター 日本化学物質辞書を用いたライフサイエンス系DBの化合物情報統合の取り組み pdf-i
13  藤田典昭 産業技術総合研究所 糖鎖創薬技術研究センター  糖鎖統合データベースのオントロジー化に対応したシステムの開発 pdf-i
14  鈴木芳典 産業技術総合研究所 糖鎖創薬技術研究センター GlycoProtDBのRDF化 pdf-i
15  新町大輔 創価大学 国際糖鎖構造リポジトリの開発 pdf-i
16  山田一作 野口研究所 国際標準化糖鎖線形表記法~国際糖鎖構造データリポジトリへ向けて~ pdf-i
17  村上勝彦 産業技術総合研究所 創薬分子プロファイリング研究センター 経済産業省ライフサイエンスデータベースプロジェクト・ポータルサイトMEDALS
18  五十嵐芳暢 医薬基盤研究所 創薬基盤研究部 トキシコゲノミクス・インフォマティクスプロジェクト アジュバントデータベースの開発とトキシコゲノミクスデータの統合に向けて
19  坂手龍一 医薬基盤研究所 難病・疾患資源研究部 難病資源研究室 創薬・疾患研究のための生物資源・疫学研究データベースの開発 pdf-i
20  伊藤真和吏 医薬基盤研究所 創薬基盤研究部 バイオインフォマティクスプロジェクト 創薬・疾患研究のためのデータベース横断検索システム Sagace pdf-i
21  陳怡安 医薬基盤研究所 創薬基盤研究部 バイオインフォマティクスプロジェクト Integrated pathway clusters for gene set analysis and target prioritization pdf-i
22  田辺麻央 京都大学化学研究所 病原体ゲノムの薬剤耐性シグネチャーモジュール pdf-i
23  米納朋子 京都大学化学研究所 医薬品相互作用ネットワーク解析のための医薬品グループ pdf-i
24  若栗浩幸 東京大学大学院新領域創成科学研究科 マルチオミックスデータと疾患関連変異に関する統合 トランスクリプトームデータベース(DBTSS) pdf-i
25  小池麻子 日立製作所 中央研究所 統合化推進プログラムにおけるヒトゲノムバリエーションデータベース
26  川嶋実苗 科学技術振興機構 バイオサイエンスデータベースセンター バイオサイエンスデータベースセンター(NBDC)ヒトデータベース1周年を迎えて pdf-i
27  坊農秀雅 情報・システム研究機構 ライフサイエンス統合データベースセンター NGSデータの利用を促進する統合環境の構築とサービスの提供 pdf-i
28  大田達郎 情報・システム研究機構 ライフサイエンス統合データベースセンター 公共NGSデータの活用を促進する検索システムの構築 pdf-i
29  小野浩雅 情報・システム研究機構 ライフサイエンス統合データベースセンター 遺伝子発現リファレンスデータセット RefEx pdf-i
30  内藤雄樹 情報・システム研究機構 ライフサイエンス統合データベースセンター 統合遺伝子検索GGRNAと高速塩基配列検索GGGenome:塩基配列データベースをすばやく検索するウェブサーバ pdf-i
31  遠里由佳子 理化学研究所 生命システム研究センター SSBD: 生命動態システム科学のデータベース開発とその進展 pdf-i
32  京田耕司 理化学研究所 生命システム研究センター BDML: 生命動態に対する時空間定量データを記述する言語 pdf-i
33  金城玲 大阪大学蛋白質研究所 蛋白質構造データバンク(PDBj)の高度化と統合的運用 pdf-i
34  小林直宏 大阪大学蛋白質研究所 Metabolonote: 生体高分子NMRデータベース(BioMagResBank)における統合化と関連ツール群 pdf-i
35  金谷重彦 奈良先端科学技術大学院大学 情報科学研究科 計算システムズ生物学研究室 KNApSAcK Family DB: 代謝物-生物活性データベースKNApSAcK Metabolite Activityの研究開発
36  櫻井望 かずさDNA研究所 産業基盤開発研究部 実験条件の専用管理システムMetabolonoteによるメタボロミクス実験データリソースの統合化 pdf-i
37  中谷明弘 大阪大学大学院 医学系研究科 遺伝子オルソログDBによる植物ゲノムDBの統合 pdf-i
38  市原寿子 かずさDNA研究所 植物ゲノム情報活用のための統合研究基盤の構築 pdf-i
39  伊藤剛 農業生物資源研究所 農学系ゲノム研究におけるNGSデータ解析支援のためのGalaxy/NIASの構築
40  土井考爾 農業生物資源研究所 農業生物先端ゲノム研究センター ゲノムリソースユニット SOGO: 農畜産物ゲノム研究のためのデータベース統合と解析環境の整備 pdf-i
41  中村保一 情報・システム研究機構 国立遺伝学研究所 DDBJセンター DDBJ pdf-i
42  仲里猛留 情報・システム研究機構 ライフサイエンス統合データベースセンター ライフサイエンスデータの統合化を支えるITインフラ pdf-i
43  内山郁夫 自然科学研究機構 基礎生物学研究所 理論生物学領域 MBGD: 大規模比較ゲノム解析基盤としての微生物ゲノムデータベース






番 号 1
タイトル 情報探索と俯瞰をアシストする生命科学データベース横断検索
発表者 大波純一1)、杉崎太一朗2)、青木健一2)、平井信一2)、牧口大旭2)、 奥村利幸2)、川本祥子3)、畠中秀樹1)、三橋信孝1)
所 属 1)科学技術振興機構 バイオサイエンスデータベースセンター 2)三井情報株式会社  3)情報・システム研究機構 ライフサイエンス統合データベースセンター 
要 旨 生命科学データベース横断検索は、国内に散在する生命科学系公開データベースの中身の、一括検索を行うための基盤として公開されている。444件のデータベース、1000万件以上のエントリ(2014年7月時点)が検索対象として登録されており、利用者は本サイトに居ながら、各データベースの内部へ瞬時にアクセスすることができる。本環境は医薬基盤研究所、農業生物資源研究所、産業技術総合研究所・創薬分子プロファイリング研究センター、産業技術総合研究所・糖鎖医工学研究センターと共同で管理・運用を行っており、ライフサイエンス統合データベースセンターのサービスとも連携を行っている。2014年6月にインターフェースを刷新し、いくつかの新たな機能を実装した。利用者がより感覚的に検索を行えるようなカテゴリ表示への変更や、サムネイル画像の追加、ヒット件数検索の機能追加を実施した。今後も生命科学系データベース探索の基盤として、かつデータベースを俯瞰することのできる展望台のような場として、効率的に有用な情報が得られるよう、環境改善を継続する。
番 号 2
タイトル データベースの再利用・再構築と生命科学系データベースアーカイブ
発表者 信定知江1)、大久保克彦2)、井上圭介3)、熊谷禎洋2)、畠中秀樹1)
所 属 1)科学技術振興機構 バイオサイエンスデータベースセンター 2)株式会社日立ソリューションズ 3)株式会社日立公共システム
要 旨 生命科学系データベースアーカイブは、国内で産生されたデータをダウンロード可能な形で長期間維持するサービスである。統合化推進プログラムのDBも加え約90DBとなり、巨大画像ビューアなど機能的にも拡充しているが、その先の目的はDBの再利用・再構築を介して統合を進めることにある。DB再利用についてはアーカイブを補完するため、類似ダウンロードサイトやカタログ収載DBのダウンロード可能性の調査も進めている。 DB再構築についてもTogoDBの自動RDF化産物をトリプルストアに載せるなどしてきたが、DB間を繋ぐことに関しては、前回ユースケースを数種提示した後TogoDBのクラス定義機能の検討を進めているものの、クラスは細かく定義しないと実際に繋がるかどうかの判別が難しい。そこでDB間共通のIDや名称の有無を調べたところ、65DB中20DBが他と繋がることがわかった。我々はヒト遺伝子統合検索HOWDYや蛋白質関連DB統合検索TogoProtのResource Description Framework(RDF)化を行っており、これらやJ-GLOBALをRDF化したデータをハブDBとして補うことでアーカイブDBの統合を実現していきたい。
番 号 3
タイトル 新しい日本語Webコンテンツ、「新着論文レビュー」と「領域融合レビュー」
発表者 飯田啓介
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨 ライフサイエンス統合データベースセンターは、日本語Webコンテンツとして、「ライフサイエンス 新着論文レビュー」および「ライフサイエンス 領域融合レビュー」を公開している。「新着論文レビュー」は、トップジャーナルに掲載された日本人を著者とする生命科学分野の論文について、論文の著者自身の執筆による日本語のレビューを、だれでも自由に閲覧・利用できるよう、いち早く公開するもので、すでに800本近くが公開されている。「領域融合レビュー」は、生命科学において注目される分野・学問領域における最新の研究成果について、第一線の研究者の執筆による日本語のレビューを、だれでも自由に閲覧・利用できるよう、無料で公開するもので、すでに30本以上が公開されている。ともに、広く生命科学全般にかかわる教員・研究者および大学院生・学生を対象とし、とくに読者として生命科学において専門分野の異なる人を意識している。よりわかりやすいものとするため、用字・用語の統一にくわえ、生命科学専門の編集者の視点から一文一文を吟味して大胆な修正を行っている。公開されたレビューはクレジットの明記を条件に、自由に転載・改変・再利用を行える。
番 号 4
タイトル 分散環境におけるRDF基盤構築技術の研究開発
発表者 山口敦子、呉紅艶、山本泰智
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨 計測機械の進歩に伴い、ライフサイエンス分野におけるデータ量は増大の一途にある。このような状況の下、膨大なデータを取り扱うため、あるいは、研究室等に分散して保持されるデータを取り扱うために、今後、Resource Description Framework(RDF)基盤の分散環境構築技術はより重要になってくることが予想される。しかしながら、昨年度までの調査により、複数の計算機上でのトリプルストア(RDF DBマネジメントシステム)構築技術においても、複数のサイトに蓄積されたRDFデータの検索技術においても、速度や安定運用性などの面で未熟な点が多く、実用に向けて解決しなければならない問題が数多く存在する。そこで、本発表では、これらの問題点について議論すると共に、問題解決のための技術、例えば、RDFデータの分割技術、分散して保持されているデータの検索技術などの研究開発について、現状とその展望について述べる。
番 号 5
タイトル RDFによるデータ統合と相互運用性のための技術開発
発表者 片山俊明1)、西澤達也2)、三嶋博之3)、川島秀一1)、岡本忍1)、藤澤貴智4)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター  2)株式会社 情報数理バイオ 3)長崎大学原爆後障害医療研究所 4)情報・システム研究機構国立遺伝学研究所
要 旨 基盤的データ・公共データ・小規模データを、セマンティック・ウェブ技術で統合するための最近の技術開発について報告する。生命科学のDBに共通する基盤的なデータについては、統合化推進プログラムの参画機関と月1回開催のSPARQLthonなどの会議を通じて、必要なオントロジーの開発、URIやResource Description Framework(RDF)モデルの整備、データのRDF化について技術的な支援を行っている。特に、ゲノム情報においては、これまで微生物を対象にTogoGenomeを開発してきたが、今年度日本DNAデータバンク(DDBJ)、Swiss Institute of Bioinformatics(SIB)、the European Bioinformatics Institute (EMBL-EBI)などのグループとともに、INSDCの塩基配列DBとEnsemblゲノムDBで共通のデータモデルを開発し真核生物も対象として相互運用性の向上を図った。一方で、まだRDF化が進んでいない公共DBについては、TogoWSサービスを通じて、データ取得とRDF化をオンデマンドで提供している。昨年度からUCSCのゲノムDBにも対応し、REST APIを用いて容易にデータアクセスが可能になった。さらに、研究者のもつ小規模データについてはTogoDBサービスを提供しており、表形式のデータを容易に高機能なDBとして公開できるだけでなく、RDF生成やSPARQLエンドポイントの公開、オントロジー編集機能の追加、D2RQの採用によるタイムラグのないデータ管理への対応などを進めている。
番 号 6
タイトル TogoGenome / TogoStanza の新規機能開発
発表者 川島秀一、岡本忍、片山俊明
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨 TogoGenomeおよび TogoStanzaの最近開発された新機能について報告する。TogoStanzaは、SPARQLエンドポイントからRDFデータを検索し可視化を行う「スタンザ」を構築するフレームワークである。TogoGenomeは、ゲノムを中心とした生命科学情報を統合検索するウェブサービスであり、複数のスタンザを組み合わせて検索結果を表示する。これまで複数のオントロジータームを指定することによるファセット検索、およびGGGenomeを利用した配列検索を実現してきたが、新たにキーワード検索、ID converter/resolver、nano stanzaの実装を行った。テキスト検索は、結果表示に利用される各スタンザ上のテキストについて、任意のキーワードについてテキスト検索を可能にする。ID converter/resolverでは、任意のデータベースエントリー間のリンク情報を対話的に検索できる。またnano stanzaは、情報を要約する複数のアイコン風のスタンザによって検索結果の内容を素早く把握するための機能である。この他、新規に開発したスタンザについても報告したい。
番 号 7
タイトル 日本語コンテンツに対するセマンティックウェブ技術の適用
発表者 山本泰智
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨 ライフサイエンス統合データベースセンター(DBCLS)では新着論文レビューや領域融合レビューなどの生命科学分野における日本語のコンテンツを発信している。また、ライフサイエンス辞書プロジェクト[1]において編纂されている、生命科学分野の専門用語を対象とした日英対訳やシソーラスなどを収めたライフサイエンス辞書をセマンティックウェブ技術で利用し易いRDFデータとして公開している。一方で、UniProtやChEMBL、あるいはOrphadataなどの生命科学分野における英語主体のデータベースがRDFデータとして取得できるようになってきている。セマンティックウェブ技術はその性格上、言語横断的なサービスを効率良く開発できると考えられることから、当該技術を用いて、日本語を母国語とする研究者が日本語で自身の研究に関する知識を効率良く取得できるようなサービスの研究開発を進めている。本発表では現状と今後の展望について報告する。 [1] http://lsd.pharm.kyoto-u.ac.jp/
番 号 8
タイトル 表現型情報でつなぐフェノーム統合データベース
発表者 高月照江、矢田有加里、齋藤実香子、桝屋啓志
所 属 理化学研究所 バイオリソースセンター
要 旨 遺伝子の多様性の結果として現れる生命の表現型(フェノタイプ)の情報を、統一したデータ形式を用いて公開するための統合データベースの作成を行っている。平成23-25年度統合化推進プログラムの開発で作成した、マウス(約5,000系統)、細胞(約3,700系統)、微生物(14,000株)に加えて、新たな生物種として、ラット(約1,000系統)、メダカ(約500系統)、ゼブラフィッシュ(約500系統)、マウスCreドライバー系統の発現部位情報(約100系統)等の表現型(フェノーム)情報を幅広い研究コミュニティーから収集し、それらの情報を、RDFのデータ形式を用いて公開していく予定である。 表現型(フェノーム)情報は、生物種の違いを超えて、同じ形式でデータを整理することが可能で、これは各種オントロジーを利用して実現している。  研究分野の垣根を越えて、標準化、統合化、体系化し、更にゲノム情報や分子情報とともに横断的に入手可能にすることで、利用者がその目的に応じ、必要な生物のフェノーム情報について、多様な目的に利活用できるように支援を行う。
番 号 9
タイトル Genome Refine: ゲノムアノテーション支援ウェブサービスにおけるセマンティックウェブ技術の利用
発表者 藤澤貴智1)、森宙史2)、岡本忍3)、山本泰智3)、片山俊明3)、川島秀一3)、谷澤靖洋1)、神沼英里1)、大山彰4) 、菅原秀明4)、内山郁夫5)、黒川顕2)、中村保一1)
所 属 1)情報・システム研究機構 国立遺伝学研究所 生命情報研究センター 2)東京工業大学大学院 生命理工学研究科   3)情報・システム研究機構 ライフサイエンス統合データベースセンター  4)インシリコバイオロジー株式会社  5)自然科学研究機構 基礎生物学研究所 理論生物学領域
要 旨 MicrobeDB.jpプロジェクトでは、セマンティックウェブ技術を用いて微生物のデータベースおよびデータの統合化を進めている。我々は、ゲノム解析支援および非公開ゲノム情報の公開促進を目的として、ゲノムアノテーション支援ウェブサービスGenome Refineを開発・公開した。本サービスはユーザ認証を有し、解析パイプラインMiGAPの解析結果であるゲノム情報およびメタデータを入力として、ゲノムアノテーションのためのデータベース環境と形式変換サービスを提供する。Genome Refineはファイル変換形式の1つとして、ライフサイエンス統合データベースセンター主導による国際的な合意に基づき設計されたゲノム情報RDFとしても出力される。また、本サービスのメタデータ入力項目についてはOWLで定義され、SPARQLを介してウェブアプリケーションの実装と切り離して定義されており、メタデータについてもRDF形式で出力される。また、これらのデータはgitサーバを介してバージョン管理されている。本システム設計を通じて、更新系データベースにおけるセマンティックウェブ技術を用いる諸問題についてデータベース運用の視点から議論したい。
番 号 10
タイトル 微生物の生息環境を記述するオントロジーの拡張とMicrobeDB.jpでの利用
発表者 山本希1)、岡本忍2)、川島秀一2)、鈴木真也3)、森宙史3)、黒川顕1),3)、MicrobeDB.jpプロジェクトチーム2),3)
所 属 1)東京工業大学地球生命研究所 2)情報・システム研究機構 ライフサイエンス統合データベースセンター3)東京工業大学大学院生命理工学研究科
要 旨 新型シーケンサーの普及により、細菌のゲノムやメタゲノム解析が盛んに行われ、公共データベース(DB)に膨大な配列データが登録されている。それらの配列データには、サンプルを取得した環境の情報であるメタデータが併記されているが、これらは用語や記述が統一されていないため、DBを検索しても目的のデータを過不足なく得る事が困難であった。そこで我々は、原核生物の生息環境やヒト感染症に関連するオントロジーを構築し、微生物統合DB「MicrobeDB.jp」に組み込むことで高度な検索を可能とした。本研究では新たに複数のDBから約20,000のメタゲノムデータを収集し、メタデータと環境関連語句オントロジー(MEO)および疾病関連語句オントロジー(PDO)との対応付けとオントロジーの拡張を行った。さらに、植物DBとの連携を視野に入れ、まずは植物感染症に関連するデータを実装するために、関連語句のオントロジーを新たに構築した。  以上のオントロジーの利用により、MicrobeDB.jpにおいて、膨大なデータに基づいた環境データと目的生物種の存在割合の関連や、疾病の性状と微生物との関連を示唆することが可能となった。
番 号 11
タイトル 微生物統合データベース MicrobeDB.jpの超高度化
発表者 黒川顕1)、内山郁夫2)、菅原秀明3)、中村保一3)、MicrobeDB.jpプロジェクトチーム1),2),3)
所 属 1)東京工業大学地球生命研究所 2)自然科学研究機構 基礎生物学研究所 理論生物学領域 3)情報・システム研究機構 国立遺伝学研究所 生命情報研究センター
要 旨 微生物は多様性を特徴としており、発酵や抗生物質生産、感染症など古くから様々な人間活動に影響を与えてきた。微生物を対象とする研究は歴史も古く、蓄積されたデータや知識は膨大かつ多様であり、ゲノムやメタゲノムなどの大規模データも多数産出されているため、これらを横断的かつ簡便に利用出来れば、新たな仮説や研究分野の創出がより容易になると期待される。我々は、国内外に散在する細菌の各種オミックス情報を広く収集し、遺伝子、ゲノム、環境の3つの軸に沿って遺伝子機能、分類学的情報、菌株保存情報、表現型情報などの知識を整理し、ゲノム情報を核としてセマンティックウェブ技術により統合した統合データベース「MicrobeDB.jp」をこれまで開発してきた。本研究では、MicrobeDB.jpを、細菌を超えて真菌類、藻類を対象として拡張し、データの収集や更新の自動化など持続可能なシステムの構築、統合DBを利用した解析結果を提示するアプリケーション群の開発や利用性の向上を徹底する事で、単なる統計量の羅列ではなく、大規模データから新規知識を容易に引き出す事が可能なシステムを構築する事を目標として研究開発を行っている。
番 号 12
タイトル 日本化学物質辞書を用いたライフサイエンス系DBの化合物情報統合の取り組み
発表者 櫛田達矢1)、山田一作2)
所 属 1)科学技術振興機構 バイオサイエンスデータベースセンター 2)野口研究所
要 旨 日本化学物質辞書(日化辞)はJSTが開発する日本最大級の化合物のデータベースである。収録件数は320万件を超え、その情報は日化辞Web(http://nikkajiweb.jst.go.jp/)を通し、インターネット上で無料一般公開されている。現在、既存の日化辞のRDFデータに対して、NCBIのPubChemやEBIのChEMBLのRDFデータの記述に採用されているChemical Information Ontology(CHEMINF)およびSemanticscience Integrated Ontology(SIO)を用いた日化辞RDFデータの拡張を行い、今後これら主要な化合物DBとの連携とリンク情報の拡充を進める予定である。また日化辞の化合物IDとそれに対応するInChI、 InChIKeyなどの情報を提供し、NBDC統合化推進プログラムで開発、運用中のDB内の化合物に対し日化辞IDを付与する仕組みの構築およびそのガイドラインを検討している。これによりDB間の化合物のリンク付け作業の負担が軽減する他、日化辞をハブとした化合物情報の統合が促進されることが期待される。
番 号 13
タイトル 糖鎖統合データベースのオントロジー化に対応したシステムの開発
発表者 ソロビヨワ・イェレナ1)藤田典昭1)、鹿内俊秀1)、木下聖子2)、成松久1)
所 属 1)産業技術総合研究所 糖鎖創薬技術研究センター 2)創価大学
要 旨 我々は文部科学省委託研究開発事業「総合データベースプロジェクト」やJST/NBDC の「ライフサイエンスデータベース統合推進事業」に参加し、一貫して糖鎖関連データベースの統合を推進している。近年、World Wide Web上のデータに意味を持たせ、連携を容易にする事が出来るセマンティックWeb技術は、ライフサイエンスデータを連携するための手段としても注目されている。我々は、セマンティックWeb技術を用いることにより、オントロジーの公開、語彙の共有、関連オントロジーとの連結が可能になることから、従来から開発し公開してきた糖鎖関連データベースで取扱っているデータに対してオントロジーを構築し、情報を提供して行く事とした。また、オントロジーを必要としないユーザが既存のデータベースと同じように利用出来るように、検索や階層構造の閲覧が簡単に出来るユーザインタフェースを開発し提供する。さらに、NBDCの統合化推進プログラムで多く利用されている「TogoStanza」や「Exhibits」などのWeb技術を積極的に用いることにより、Webページのパーツ化による再利用性や開発効率の向上を行う事とした。このような方針のもと、疾患関連の糖鎖データベースに対してオントロジー化を進め、ユーザインターフェースを含めたシステムの開発を行ったのでこれを報告する。
番 号 14
タイトル GlycoProtDBのRDF化
発表者 鈴木芳典1)、藤田典昭1)、新町大輔2)、木下聖子2)、鹿内俊秀1)、梶裕之1)、成松久1)
所 属 1)産業技術総合研究所 糖鎖創薬技術研究センター 2)創価大学 
要 旨 我々は「ライフサイエンスデータベース統合推進事業」の一環として糖鎖関連データベースの統合を推進している。近年、コンピュータが自動処理を行えるデータを付与することで、より高度な情報探索や語彙の共有、情報の集約・連結を実現できるセマンティックWEBが注目されている。我々は、データの流通性・相互運用性をより高めるため、セマンティックWEBへの提供形式を構築する事とした。このような方針の中、糖鎖修飾されたタンパク質とその修飾位置情報のデータベースGlycoProtDB(GlycoProtein Database)のRDF表現化を行った。GlycoProtDBのRDFは、糖ペプチドRDF(糖鎖修飾の位置情報、タンパク質上でのペプチド位置情報)と、糖タンパク質RDF(遺伝子名、組織、糖ペプチドの捕集に用いたレクチン名)の2種類のRDFに分け正規化を行った。また、ユーザーインターフェースの開発にあたっては、WEBページへのHTML埋め込み方式による再利用可能なRDFデータの可視化パーツを開発した。 http://glycoinfolab.jp/jstanza/gpdb/index
番 号 15
タイトル 国際糖鎖構造リポジトリの開発
発表者 新町大輔1)、木下聖子1),2)、山田一作3)、藤田晶大1)、土屋伸一郎1)、青木ポール信幸1)、松原正陽3)、藤田典昭2)、鈴木芳典2)、イェレナ・ソロビヨワ2)、鹿内俊秀2)、奥田修二郎4)、川嵜敏祐5)、成松久2)
所 属 1)創価大学 2)産業技術総合研究所 糖鎖創薬技術研究センター 3)野口研究所 4)新潟大学 5)立命館大学
要 旨 現在世界中の研究者によって利用されている国際リポジトリであるGenBankやPDBは、登録された遺伝子配列やタンパク質の立体構造に任意なIDを割り当てることができ、そのIDは、論文で参照できるなど、国際的な場面で利用可能である。しかし、近年様々な糖鎖関連データベースが開発されてきたが、糖鎖構造及び配列の国際リポジトリは今のところ存在しない。そのため、国際リポジトリの必要性が増してきている。そこで我々は、米国の糖鎖研究者と共同で国際糖鎖構造リポジトリの開発を行った。本プロジェクトではGlyTouCanと名付けた国際糖鎖構造リポジトリのウェブインターフェースを開発し、米国のGlySpaceプロジェクトで開発された糖鎖構造の登録システムを用いて、糖鎖構造の登録を行う。登録の際、新しい構造には、新しいIDが発行され、登録したユーザーの情報と一緒に登録される。また、登録されている糖鎖構造を糖鎖の組成やモチーフから検索することができる。GlyTouCanは http://www.glytoucan.org/ からアクセスできる。
番 号 16
タイトル 国際標準化糖鎖線形表記法~国際糖鎖構造データリポジトリへ向けて~
発表者 山田一作1)、木下聖子2),3)、松原正陽1)、土屋伸一郎2)、新町大輔2)、藤田晶大2)、青木信幸2)、鹿内俊秀3)、鈴木芳典3)、ソロビヨワ・イェレナ3)、藤田典昭3)、奥田修二郎4)、川嵜敏祐5)
成松久3)
所 属 1)野口研究所 2)創価大学  3)産業技術総合研究所 糖鎖創薬技術研究センター 4)新潟大学 5)立命館大学
要 旨 近年、World Wide Webの利便性を向上させ得るセマンティックウェブはライフサイエンスデータを連携するための手段としても注目されている。糖鎖研究により生産された各種データに関しても、この新潮流に対応した開発が進んでいる。この流れを受けて糖鎖構造をResource Description Framework(RDF)をベースとしたセマンティックウェブに対応するための新たな線形表記法としてWURCS(Web3 Unique Representation of Carbohydrate Structures)を開発した。WURCSの特徴は、1)URIとして可能な線形文字列表記、2)グリコシド結合が不明確など曖昧さを含む糖鎖構造を一意に文字列表記である。WURCSは、アグリコンを除いた糖鎖構造を線形文字列として記述するため、各種データベースに含まれる分子をWURCSへ変換することにより、共通の糖鎖構造を含む分子を検索することができる。また、国際糖鎖構造データリポジトリ開発におけるWURCS活用について紹介する。
番 号 17
タイトル 経済産業省ライフサイエンスデータベースプロジェクト・ポータルサイトMEDALS
発表者 村上勝彦1)、今西規1),2)、福井一彦1)
所 属 1)産業技術総合研究所 創薬分子プロファイリング研究センター  2)東海大学医学部 基礎医科学分子生命科学
要 旨 「経済産業省ライフサイエンスデータベースプロジェクト」は平成23年度から平成25年度に実施され、現在ポータルサイトMEDALSは産業技術総合研究所にて継続的に運用を続けている。今年度(平成26年度)は、便覧の更新を中心に活動を行い、長期の安定な運用を図るためにクラウドへの移行を行った。また、前年度から改修していたツール、利用者が興味をもっている論文に関係する新規論文を推薦する文献推薦システム「PubMedScan」について、改良版を公開した。公開した機能の1つは、前年度の任意のアラート間隔設定や過去1ヶ月程度の関連文献を検索できるようにしたもので、もう1つはMendeley等、他の文献管理ソフトに登録された文献リストをXML、RIS、BIBの形式でとりこめる機能である。それぞれ専用のインターフェース画面を設け、ユーザーの便宜を図った。
番 号 18
タイトル アジュバントデータベースの開発とトキシコゲノミクスデータの統合に向けて
発表者 五十嵐芳暢1)、Johan T. Nystrom-Persson2)、山田弘1)、石井健3)、水口賢司4)
所 属 1)医薬基盤研究所 創薬基盤研究部 トキシコゲノミクス・インフォマティクスプロジェクト 2)株式会社レベルファイブ  3)医薬基盤研究所 創薬基盤研究部 アジュバント開発プロジェクト 4)医薬基盤研究所 創薬基盤研究部 バイオインフォマティクスプロジェクト
要 旨 アジュバントはワクチンの免疫応答を増強する目的で、抗原と共にワクチンに添加される物質の総称である。ワクチンにはインフルエンザワクチン等の感染症予防以外にも、抗腫瘍ワクチンやアレルギー疾患ワクチン等の治療用ワクチンも開発されている。アジュバントはそれぞれのワクチンの目的に合った免疫応答を増強する必要がある。しかしながらアジュバントに関する有効性や安全性についての科学的指標はまだ確立していない。 そこで新規アジュバント候補物質の有効性と安全性を探索するために、2012年度から始まったアジュバントデータベースプロジェクトでは、アジュバントを投与したラットおよびマウスの多臓器の網羅的遺伝子発現変動プロファイルを取得している。ラットに薬剤を投与したときの肝臓の遺伝子発現変動から、安全性予測バイオマーカーの取得が可能であるように、アジュバント投与動物においても肝臓や他臓器における遺伝子変動から、安全性や有効性の指標となるバイオマーカーが得られるものと期待される。本報告では目指す目標とアジュバントデータとトキシコゲノミクスデータの統合データベースの開発について報告する。
番 号 19
タイトル 創薬・疾患研究のための生物資源・疫学研究データベースの開発
発表者 坂手龍一1)、深川明子2)、水口賢司3)、山田弘4)、増井徹5)、塩谷恭子6)、松田潤一郎7)
宮本恵宏6)、松山晃文1),2)
所 属 1)医薬基盤研究所 難病・疾患資源研究部 難病資源研究室 2)同研究所 難病・疾患資源研究部 政策・倫理研究室 3)同研究所 創薬基盤研究部 バイオインフォマティクスプロジェクト 4)同研究所 創薬基盤研究部 トキシコゲノミクス・インフォマティクスプロジェクト 5)慶應義塾大学 医学部 臨床遺伝学センター 
6)国立循環器病研究センター 7)医薬基盤研究所 難病・疾患資源研究部 疾患モデル小動物研究室
要 旨 厚生労働省の研究機関である医薬基盤研究所では、創薬・疾患研究をサポートするデータベース群を開発・公開している。メディカル・バイオリソース・データベース(MBRDB、http://mbrdb.nibio.go.jp)では、ヒト疾患研究の基盤となる生物資源情報等を公開している。2013年度、厚生労働省の研究機関にアンケート調査を実施し、提供された実験動物情報(公共データベース未収載を含む)を公開した。また、日本人を対象とする疫学研究の調査を行っており、調査結果をMBRDBから今年度公開予定である。現在、ゲノムコホートへの関心が高まりを見せており、過去の疫学研究の情報が重要性を持つ。最終的にはメタアナリシスを可能とするインフラ整備に寄与することを目標としている。これらの生物資源・疫学研究情報は、医薬基盤研究所横断検索システム(http://alldbs.nibio.go.jp)の対象に追加する。これにより、トキシコゲノミクスデータベース(Open TG-GATEs、http://toxico.nibio.go.jp)等との横断検索を可能にする。さらに、NBDCと連携している統合検索データベースSagace(http://sagace.nibio.go.jp)と連携して活用促進をはかり、創薬・疾患研究に寄与することを目指す。
番 号 20
タイトル 創薬・疾患研究のためのデータベース横断検索システム Sagace
発表者 伊藤真和吏1)、森田瑞樹1),2)、五十嵐芳暢3)、陳怡安1)、長尾知生子1)、深川明子4)、坂手龍一5)、水口賢司1)
所 属 1)医薬基盤研究所 創薬基盤研究部 バイオインフォマティクスプロジェクト 2)東京大学大学院情報理工学系研究科 ソーシャルICT研究センター 3)医薬基盤研究所 創薬基盤研究部 トキシコゲノミクス・インフォマティクスプロジェクト 4)同研究所 難病・疾患資源研究部 政策・倫理研究室 5)同研究所 難病・疾患資源研究部 難病資源研究室 
要 旨 医薬基盤研究所では、JSTバイオサイエンスデータベースセンターと連携し、データベース横断検索システム “Sagace http://sagace.nibio.go.jp/”を開発・公開している。 Sagaceは、創薬・疾患に特化した約150のデータベースを選定・分類して検索対象とし、ファセット(データベースの分類)による検索結果の効率的な絞り込みとメタデータ(データに関する事項を記述したデータ)の活用を特徴としている。検索クエリの同義語展開にはライフサイエンス辞書(LSD)とICD10対応標準病名マスターを使用しており、一般的な横断検索システムよりも創薬・疾患に関する情報を網羅的に検索することが出来る。 今年度は検索対象となる国内外の創薬・疾患に関連するデータベースを強化した。また、ファセット項目については医薬品に関する項目を作成し、医薬に関するデータベースに対して特定の切り口で検索結果を絞り込めるようにした。 メタデータの付与には、以前から対応していたmicrodata形式に加え、RDFa Lite、JSON-LD形式にも対応させ、データベース管理者がメタデータを付与する過程で、事前に検索結果に反映される検索結果のイメージを得られるツールも開発した。Sagaceでは、これらの取り組みを通じ、より効率的な検索システムの構築を目指している。
番 号 21
タイトル Integrated pathway clusters for gene set analysis and target prioritization
発表者 陳怡安、ロケシュ・テリパチ、ブノア・デザイ、ヨーハン・ニーストロム、シャンダー・アハマド、水口賢司
所 属 医薬基盤研究所 創薬基盤研究部 バイオインフォマティクスプロジェクト
要 旨 Prioritising candidate genes from the large gene sets emerging from high throughput experiments is an important and challenging task. A commonly used approach to achieve this goal is to estimate the enrichment of specific biological themes, such as pathways within the gene list of interest. However, biological pathway information as compiled in different databases often differs in scope and content, preventing a more effective and comprehensive characterisation of gene sets. We have integrated the biological pathways from different databases into the TargetMine data warehouse (http://targetmine.nibio.go.jp) [1]. We introduced a new approach to clustering biologically coherent pathways and employed them for functional analysis of large gene sets [2]. The biological relevance of the constructed pathway clusters was established using independent quantitative measures. The effectiveness of the constructed pathway clusters was demonstrated by the analysis of diverse gene sets associated with different human diseases gathered from the literature. The pathway clusters in TargetMine are likely to provide a concise, manageable and biologically relevant means of functional analysis of gene sets and to facilitate candidate gene prioritisation. The simplicity and success of the approach suggest that it could be easily applied to generate integrated biological annotations consisting of diverse functional themes. 【参考文献】 [1]Chen YA, Tripathi LP, Mizuguchi K. (2011) TargetMine, an Integrated Data Warehouse for Candidate Gene Prioritisation and Target Discovery. PLoS ONE 6(3): e17844. [2]Chen YA, Tripathi LP, Dessailly BH, Nystr?m-Persson J, Ahmad S, Mizuguchi K. (2014) Integrated pathway clusters with coherent biological themes for target prioritisation. PLoS ONE 9(6): e99030.
番 号 22
タイトル 病原体ゲノムの薬剤耐性シグネチャーモジュール
発表者 田辺麻央1),2)、矢野亜津子2)、金久實1),2)
所 属 1)京都大学化学研究所 2)NPOバイオインフォマティクス・ジャパン
要 旨 感染症流行への対策として病原体ゲノムのシークエンシングを直ちに行い、過去の流行と比較して菌株等の同定を行うことが可能になってきた。一方ではこのような全体的な配列比較だけでは、局所的な遺伝子群や特定遺伝子の変異等に関連したフェノタイプを見落とす可能性がある。本研究ではシグネチャーモジュールと呼ぶ遺伝子セットで表現した方法論を開発しており、本発表では薬剤耐性のシグネチャーモジュールを紹介する。モジュールとはKEGG MODULEデータベースにあるKEGGモジュールのことで、KEGG Orthology (KO) グループの識別子であるK番号のセット(正確には論理式)で表現される。薬剤耐性のメカニズムには、薬剤を加水分解する酵素の生産、薬剤の標的分子の変化、薬剤の細胞外への排出などがあり、βラクタム系抗生物質についてはKEGGパスウェイマップも描かれている。ここではβラクタムその他の抗生物質について実験データをもとに、20種類ほどのシグネチャーモジュールの定義を行った。全ゲノム配列が決定されたKEGG生物種でモジュールの有無を検証し、モジュールと耐性菌の生物種分布との対応づけも行った。
番 号 23
タイトル 医薬品相互作用ネットワーク解析のための医薬品グループ
発表者 米納朋子1),3)、古道美穂1),3)、石黒真理2),3)、永吉ふみ3)、金久實1),3)
所 属 1)京都大学化学研究所 2)東京大学医科学研究所ヒトゲノム解析センター 3)NPOバイオインフォマティクス・ジャパン
要 旨 KEGGでは、限られた実験データから得られる知識をいかに一般化してより多くのデータに適用できるようにするか、という観点で知識ベースの構築が行われている。最も代表的なのがKEGG Orthology (KO) で、個別生物種での実験事実を集約したKEGGパスウェイマップはオーソログ(KO) 間の相互作用ネットワークとして表現されており、計算で推定されるオーソログ情報をもとに他の数多くの生物種に適用できるようになっている。また代謝ネットワークについてはReaction class (RC) による一般化もなされており、酵素がもつ遺伝子としての側面と反応としての側面をそれぞれKO moduleとRC moduleと呼ぶ機能モジュールで定義し、両者の対応づけを行っている。本研究では第3の一般化として、Drug group (DG) の開発を開始した。医薬品相互作用ネットワークのより一般的な理解と、個々の医薬品の相互作用予測等に用いることが目的である。医薬品相互作用としてはとくに薬物代謝酵素関連のものと標的分子関連のものに着目し、遺伝子変異・多型情報も含めて知識ベース化を行っている。
番 号 24
タイトル マルチオミックスデータと疾患関連変異に関する統合 トランスクリプトームデータベース(DBTSS)
発表者 鈴木穣1)若栗浩幸1)、河野信2)、土原一哉3)、菅野純夫1)
所 属 1)東京大学大学院新領域創成科学研究科 2)情報・システム研究機構 ライフサイエンス統合データベースセンター 3)国立がん研究センター東病院 TR分野
要 旨 我々はこれまで様々なヒト組織の公開TSS(転写開始領域)デー タベースとして、DBTSSを開発してきた。近年TSSのみならず様々な細胞のSNVデータとその他オミックスデータが内外で蓄積されてきており、本年我々は、これらの多種多様なSNVデータとオミックスデータのデータベースへの格納を行った。SNVについては約100人分の肺腺癌と、小細胞肺癌の体細胞変異を含む様々な癌ゲノム関連解析からデータを集め、データベースに登録した。オミックスデータについては、主にオリジナルデータとして、TSS-Seq、 RNA-Seq、ChIP-Seq(代表的なヒストン修飾情報等)、BS-SeqによるDNAのシトシンメチル化情報を収集しデータベースに搭載した。特に肺腺癌の26種類の培養細胞については同じ条件のオミックスデータを網羅的に収集し、様々な角度から比較解析が可能なリソースとなっている。  このように我々のデータベースはSNVの周辺情報を含めた統合的なデータリソースを提供するデータベースであり、複合的確認が可能なことによりSNVの生命現象に関連するさらなる解析の手掛かりを与えるものと期待される。
番 号 25
タイトル 統合化推進プログラムにおけるヒトゲノムバリエーションデータベース
発表者 小池麻子1)、澤井裕美2)、川嶋実苗2)、井ノ上逸朗3)、辻省次4)、徳永勝士2)
所 属 1)日立製作所 中央研究所  2)東京大学大学院 医学系研究科  3)情報・システム研究機構 国立遺伝学研究所 4 )東京大学医学部 附属病院
要 旨 SNPタイピング技術と次世代シーケンサー技術の技術革新により、ゲノムワイドな疾患関連多型・変異探索が可能となり、多くの疾患関連多型・変異が発見されつつある。我々のグループでは国内/アジアにおけるこれらのデータの散逸を防ぎ研究者間でデータ共有化するために、2007年よりGWAS-DB、 CNV-DBを、2011年度よりHuman variation DB、 HLA-DBを構築し(https://gwas.biosciencedbc.jp/)、GWASデータ、NGS変異データのサブミッションを広く呼びかけると共にデータの預け入れと再配布の運用を行ってきた。2014年度からはNBDCがデータの預け入れと再配布を実施し、その計算結果の可視化を本DBが引続き実施している。これらのDBにおいてはGWASのデータ、健常者や患者の多様な生殖細胞変異(SNV、長配列の挿入/欠失、構造多型)を収集対象とし、また、癌体細胞変異については主要なDBのドライバー変異についてもリンクを張り、日本人/アジア人の変異と表現型(疾患、薬剤応答、ウィルス耐性)との関係の体系化を目指している。更に、文献からも疾患変異・臨床情報を収集し、30,000以上のエントリーを登録している。
番 号 26
タイトル バイオサイエンスデータベースセンター(NBDC)ヒトデータベース1周年を迎えて
発表者 川嶋実苗、三橋信孝、箕輪真理
所 属 科学技術振興機構 バイオサイエンスデータベースセンター
要 旨 2012年頃より、生命科学・生物医学・環境科学分野を中心に論文のOA化や、論文に使用したデータの研究者間での共有化が進んできている。米国のNIHや英国の研究助成機関ではData Sharing Policyやそれに類する指針を公表し、研究費申請時にはData Sharing Statementの提出を義務付けるようになってきている。データ共有の動きは、ヒトに関するデータへも波及し、2013年にはGlobal Alliance for Genomics and Healthの活動が始まり、セキュアな環境下でのヒトデータの共有について、4つのワーキンググループで検討を続けている。 DNA Data Bank of Japan (DDBJ)との協力体制の下、2013年10月1日より運用を開始した『NBDCヒトデータベース』が1周年を迎える。1年間のヒトデータの共有化促進活動の経験から、ヒトデータベースへデータ提供する際に抑えておきたいポイント、および、これまでの申請状況を報告するとともに、データ提供方法の相談を受け付けることで、今後の研究におけるデータの利活用の発展につなげていきたい。
番 号 27
タイトル NGSデータの利用を促進する統合環境の構築とサービスの提供
発表者 大田達郎、小野浩雅、内藤雄樹、仲里猛留、坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨 2014年4月からライフサイエンス統合データベースセンターの一部のメンバーが国立遺伝学研究所に勤務地変更となった。そのため、動画チュートリアル(統合TV)などの有用なコンテンツの作成がこれまでのリサーチアシスタントによる「統合牧場」方式では行えなくなったため、遠隔地からのコンテンツ作成共有が可能となる仕組み”cloudfarm”を構築、コンテンツ作成が行える仕組みを構築、運用開始した。  同時に、DNA Data Bank of Japan(DDBJ)と地理的にも近くなり、連携をさらに深めている。NGSデータの検索向上のために必要なメタデータのBioProjectとBioSampleに関して調査、半自動的にデータが更新される統合環境構築の技術開発や、遺伝子発現データとして登録されるNGSデータの検索性の向上を目指したシステム開発を、DDBJの協力の下、推進している。 そして、これまで開発してきた大規模塩基配列検索技術を利用し、上記開発サービス全てがDDBJ本体の検索システムと一体的に統合的運用され、利便性の高いサービスの提供を行っていけるよう、現在開発を進めている。
番 号 28
タイトル 公共NGSデータの活用を促進する検索システムの構築
発表者 大田達郎、仲里猛留、坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨 ライフサイエンス統合データベースセンター(DBCLS)では、DDBJとの連携の元、公共データベースに登録された次世代シーケンサ(NGS)のデータを検索するシステムの開発を行っている。NGSから得られるデータはその量とデータサイズの規模が大きいだけでなく、シーケンス技術の進歩により応用例が多様化していること、ヒト研究における個人情報との関連などにより、従来の実験データよりも取り扱いが難しい。また、研究の再現性を担保する上で重要な情報であるとして、公共データベースに登録されたデータに対するアクセスを容易にすることの重要性はこれまで以上に高まっている。このような状況において、我々は公共のNGSデータの利活用を促進するため、公共データベースへのNGSデータの登録と利用状況を継続して調査しつつ、DBCLS SRA(http://sra.dbcls.jp)において、関連文献をベースにした絞り込み検索やキーワードによる全文検索、また疾患や生物分類を元にした検索など、新たな検索方法を提供している。本発表では、現在までの取り組みを紹介すると共に、複数のデータベースにまたがって管理されるデータへの対応など、これからの課題についても議論したい。
番 号 29
タイトル 遺伝子発現リファレンスデータセット RefEx
発表者 小野浩雅、坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨 RefEx (Reference Expression dataset; http://refex/dbcls/jp/ )は、4つの異なる実験手法 (EST、GeneChip、CAGE、RNA-seq)によって得られた40種類の正常組織における遺伝子発現量を並列に表現することで、手法間の比較とともに各遺伝子の発現量を直感的に比較することが可能なリファレンスデータセットである。RefExは、種々のIDや遺伝子名、キーワードで検索できるのはもちろんのこと、任意のIDセットについても複数同時に指定して検索することができ、ある特定の検索結果を指定して得ることが容易である。また、検索結果一覧からユーザが任意で選択した遺伝子について「リスト」に追加・保持する機能を利用することで、それらの詳細情報について一画面で並列に比較することが可能である。今回新たに、初代培養細胞、臓器、あるいは数多くの細胞株における大規模なヒトCAGEデータ(FANTOM5)を追加し、これまでよりも高解像度かつ広範囲な発現データを閲覧できるようになった。
番 号 30
タイトル 統合遺伝子検索GGRNAと高速塩基配列検索GGGenome:塩基配列データベースをすばやく検索するウェブサーバ
発表者 内藤雄樹、坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨 GGRNA(http://GGRNA.dbcls.jp/)は、遺伝子や転写産物をGoogleのように検索できるウェブサーバである。あらゆるキーワードや塩基配列・アミノ酸配列をひとつの検索窓に入力するだけで、NCBI RefSeqに登録された情報をすばやく検索し、入力した検索ワードを見やすくハイライトしたうえで結果を表示する。RefSeqにはゲノム、mRNA、非コードRNA、タンパク質の情報が登録されているが、GGRNAではこのうちmRNA(アクセッション番号がNM/XMで始まる)および非コードRNA(NR/XRで始まる)の情報を用いた。重複のないRefSeqを基盤とすることにより、検索の際に多数の転写産物が重複してヒットしてしまうことを防いでいる。GGRNAでは、接尾辞配列による検索インデックスをメモリではなくSSDに載せて検索することにより、大規模な塩基配列データベースを高速に検索することができる。たとえば、RefSeqに配列が収録されている全ての生物種を、わずか数秒で一度に検索可能である。また、塩基配列の検索については、高速配列検索GGGenome(http://GGGenome.dbcls.jp/)を構築してGGRNAと連携させている。GGGenomeは、ミスマッチやギャップを含む塩基配列の検索を、転写産物だけでなくゲノムに対しても行うことができるなど、塩基配列の検索に特化したサービスである。これらのサービスはREST APIを完備しており、他のデータベースやソフトウェアとも容易に連携できる。GGRNAおよびGGGenomeのすべての機能は無償で自由に利用できる。
番 号 31
タイトル SSBD: 生命動態システム科学のデータベース開発とその進展
発表者 遠里由佳子、ホー・ケネス、京田耕司、大浪修一
所 属 理化学研究所 生命システム研究センター
要 旨 顕微鏡を活用した計測や数理モデリングの発達により、現在の生命科学では時空間情報を数値として有する定量データが大量に生産されている。これら定量データとその取得に関わるメタ情報を、統一した形式で管理し共有することは、これらのデータから生物学的知識を抽出する技術の開発促進のために重要である。そこで我々は、時空間定量データとその計測に用いた動画像を管理するデータベースSystems Science of Biological Dynamics(SSBD)を構築した(http://ssbd.qbic.riken.jp)。定量データとそのメタ情報はBiological Dynamics Markup Language(BDML)で統一的に記述され、動画像はOMEROにより管理・共有される。SSBDに登録された分子や細胞等のさまざまな動態の定量データは、ブラウザ上でインタラクティブに表示され、RESTful APIで自由にアクセスできる。現在、時空間定量データを利用したデータ駆動型生命科学をめざし、定量データおよび動画像のさらなる収集と、その再利用を促進するImageJプラグインの開発を進めている。
番 号 32
タイトル BDML: 生命動態に対する時空間定量データを記述する言語
発表者 京田耕司、遠里由佳子、ホー・ケネス、大浪修一
所 属 理化学研究所 生命システム研究センター
要 旨 バイオイメージ解析技術やモデリング技術の発展に伴い、生命現象の時空間動態に対する定量データの産出が可能になった。今までに、さまざまな生命現象に対する定量データと多種多様なツールが個別に作成されてきた。しかしながら、これらの定量データとツールには相互に互換性がなく、再利用が困難であるという問題があった。そこで、本研究では、分子から細胞、個体に至るまでの生命現象の時空間動態を統一的に記述するためのデータ形式、Biological Dynamics Markup Language (BDML)を開発した。BDMLはXMLを基盤とするデータ形式である。BDMLは、既存のXMLに対するライブラリやAPIを活用することにより容易に読み取り可能であり、効率的なツール開発が可能になる。また、XMLの拡張性の高さを活かして、将来産出される新しいタイプの定量データにも柔軟に対応できる。実際に、BDMLで記述された定量データを可視化するツールや、そこから表現型特徴を抽出するツールを開発した。BDMLにより、定量データの共有とそれらに対する各種解析ツールの開発・共有の促進が期待される。
番 号 33
タイトル 蛋白質構造データバンク(PDBj)の高度化と統合的運用
発表者 金城玲1)、中川敦史1)、猿渡茂2)、鈴木博文1)、中村春木1)
所 属 1)大阪大学 蛋白質研究所 2)北里大学理学部
要 旨 タンパク質、核酸、糖鎖などの生体高分子の立体構造情報はProtein Data Bank (PDB)として集積され、2014年5月には10万件を超える構造データを蓄積している。PDBjは、国際的組織であるwwPDBの一員として、共通した品質管理によるデータ登録作業とダウンロード・サイトの運営および独自のサービス・ツールや二次データベースの提供、セマンティック化を実施している[1]。 今後は、データ登録の高度化(データ検証の改良と検証レポートの公開・配布、新たなPDBx/mmCIFフォーマットの利用の促進)と配布事業の継続に加えて、リガンド・蛋白質複合体解析による医薬スクリーニングデータの精密化・登録支援、異なる階層のデータと蛋白質構造情報との統合化のために特に蛋白質複合体に対する多面的解析ツール・サービス(分子表面データベース、基準振動による蛋白質ダイナミクス・データベース、PDBとEMDBの双方に対する構造形状の同時比較・検索等)の開発と公開を実施する。 【参考文献】 [1] Kinjo A. R.et al., Nucl. Acids Res. 40, D453-D460, 2012
番 号 34
タイトル 生体高分子NMRデータベース(BioMagResBank)における統合化と関連ツール群
発表者 小林直宏、横地政史、岩田武史、児嶋長次郎、藤原敏道
所 属 大阪大学蛋白質研究所
要 旨 PDBj-BMRBグループは米国BMRBおよびwwPDBと連携して、国際的な生体高分子NMR実験データのデータベースであるBioMagResBank(BMRB)の開発、および登録・公開拠点としての構築運営を行ってきた。米国Wisconsin大学と共同でサービスを提供しているBMRBミラーサーバーの検索ユーザーインターフェース、データの可視化ツールについてタンパク質のダイナミックな情報を扱えるなどの機能のさらなる充実を実現している。独自のポータルサイトにおいては、データ登録者の効率的な登録支援ページ、NMRデータの高度な解析支援ツールMagRO、立体構造収斂部位を自動検出するFitRobotなどを公開している。またXML化、RDF化された全BMRBエントリーを統合的に運用できるサイトの公開を開始した。ポスターにおいてはウェブ標準技術を最大限利用したデータ検索を例にして、BMRBに登録されたNMRデータの有効活用法を紹介する。
番 号 35
タイトル KNApSAcK Family DB: 代謝物-生物活性データベースKNApSAcK Metabolite Activityの研究開発
発表者 金谷重彦1)、中村由紀子1)、平井(森田)晶1)、小野直亮1)、佐藤哲大1)、荒武2)、榎本光男3)、西岡孝明1)、有田正規4)、櫻井望3)
所 属 1)奈良先端科学技術大学院大学 情報科学研究科 計算システムズ生物学研究室 2)京都大学 カゴメトマト・ディスカバリーズ講座 3)かずさ DNA 研究所 産業基盤開発研究部 4)理化学研究所 環境資源科学研究センター 
要 旨 ヒトは、動植物・微生物から栄養を獲得し恒常性を維持する。すなわち、食物の機能性を考慮し、最適化することによりヒトの健康は維持される。KNApSAcK Family DBでは、メタボローム研究の一環として、ゲノムサイエンスと薬用/食用の知識を統合的に扱ったプラットフォームに従って開発を進めている。その中でも、生物、代謝物、活性と関連したデータベースについて紹介する。生物種-代謝物関係DB(KNApSAcK Core、101、500対の生物種-代謝物の関係、5万代謝物種、2万生物種)を構築した。例えば、タマネギは食欲増進に効果があるなど、その生物のヒトに対する活性および抗菌作用のようにその生物が他の生物に対してどのような活性があるかが報告されている。このような、生物が他の生物へ与える活性を生物活性DB(Biological Activity DB、2、418種の生物活性における3万対の植物とその活性の関係)として整理・公開した。同様に、個々の代謝物が生物へ与える影響を代謝物活性DB(Metabolite Activity DB)として整理した。これらのデータベースを中心に現状と課題を報告する。
番 号 36
タイトル 実験条件の専用管理システムMetabolonoteによるメタボロミクス実験データリソースの統合化
発表者 荒武1)、榎本光男2)、西岡孝明3)、金谷重彦3)、有田正規4)櫻井望2)
所 属 1)京都大学 カゴメトマト・ディスカバリーズ講座 2)かずさDNA研究所 産業基盤開発研究部 3)奈良先端科学技術大学院大学 情報科学研究科 計算システムズ生物学研究室 4)理化学研究所 環境資源科学研究センター 
要 旨 代謝産物を網羅的に検出するメタボロミクスの技術は、生物学の他、医療や食品、環境など広い分野で応用が期待されている。一方、多様な化学的性質をもつ物質が検出対象であるため、実験条件は個々の研究で至適化され複雑となる。一般研究者が公開されたメタボロミクスの実験データを適切に解釈し利活用するためには、閲覧者が利用しやすいだけでなく、データ提供者が複雑で膨大な実験条件を効率的に記述・管理できるシステムが必要である。そこで我々はメタデータを専用で管理するデータベースMetabolonote (metabolonote.kazusa.or.jp)を開発した。Wikiを基盤に開発したMetabolonoteは、編集が容易なだけでなく、サンプル、機器分析、データ解析というメタデータの階層構造を管理できる。また、それぞれの情報にアクセスできる簡潔なID体系と、意味的検索のためのAPIを実装しており、実験データを管理する外部データベースとスムーズな連携が可能である。現在は、メタデータをRDF化しSPARQLで検索可能とすることで、生物種名等を介した他データベースとの連携強化を進めている。
番 号 37
タイトル 遺伝子オルソログDBによる植物ゲノムDBの統合
発表者 中谷明弘1)、市原寿子2)、浅水恵理香2)、平川英樹2)、中村保一2)、田畑哲之2)
所 属 1)大阪大学大学院 医学系研究科 2)かずさDNA研究所 
要 旨 緑色植物とラン藻のアミノ酸配列を配列の類似情報に基づいて網羅的に分類し、それらの間の種間や系統群間での対応関係(オルソログ関係)を整理したデータベース(以下DB)を開発している。 開発したDBは、PGDBj(Plant Genome DataBase Japan;http://pgdbj.jp)の一部(OD: Ortholog Database)としてオルソログ情報そのものを提供すると同時に、さまざまなDBを統合するためのハブの機能を担っている。これまでに、NCBI RefSeqから取得したアミノ酸配列(緑色植物約20種とラン藻約100種のそれぞれ約50万配列)の全ペア間の配列類似情報を「スーパーコンピュータ」で計算し、その結果に基づいてアミノ酸配列をクラスタリングしてオルソログ情報を生成している。また、アミノ酸配列や遺伝子間のオルソログ関係に加えて、DNAマーカーやQTL等を含めたより広範なデータの種間対応関係をオルソログ等価因子(OE: Orthologous Equivalent)として整理することにより、生物種間の比較に基づいた推定や予測を実現する手法の検討も進めている。
番 号 38
タイトル 植物ゲノム情報活用のための統合研究基盤の構築
発表者 市原寿子1)、浅水恵理香1)、平川英樹1)、中谷明弘2)、中村保一1)、田畑哲之1)
所 属 1)かずさDNA研究所 2)大阪大学大学院医学系研究科
要 旨 モデル実験植物や作物など実用植物のゲノム配列が解読され、ゲノム構造や遺伝子機能、DNAマーカー等の多種多様なゲノム研究の成果がデータベース(以下DB)を通じて公開されている。しかし、個別に構築されたDBが散在し、ユーザからの迅速なアクセスが困難となる状況が生じている。この問題を解決するため、散在する植物ゲノム関連情報を整備し、有機的に統合した情報基盤としてポータルサイトPGDBj(Plant Genome DataBase Japan;http://pgdbj.jp)を開発した。これまでに構築した「オルソログDB」、「リソースDB」、「DNAマーカーDB」の情報拡充に加え(1)生物種・配列・代謝産物をキーとしたデータ共有によるPGDBjの内部DB間および外部DBとの連携、(2)植物オントロジーの整備および共通語彙を介したDB間の連携強化、(3)オルソログ遺伝子や変異体原因遺伝子等の配列や位置情報をゲノム情報へ集約するゲノム情報アノテーションの高度化を進めている。以上によってPGDBjコンテンツのセマンティックウェブ化を実施し、植物ゲノム情報をコアとした情報検索機能の強化と拡張を目指す。
番 号 39
タイトル 農学系ゲノム研究におけるNGSデータ解析支援のためのGalaxy/NIASの構築
発表者 伊藤龍太郎1),2)、熊谷真彦1),3)、熊谷真彦1)伊藤剛1)
所 属 1)農業生物資源研究所 2)株式会社ダイナコム 3)東京大学大学院理学系研究科
要 旨 生命科学系の技術革新は目覚ましく、特に高速シーケンサー(NGS)の生産するデータ量は極めて膨大で、そのデータ解析が研究者の大きな負担になっている。NGSの大量情報を高速に処理することができれば、大規模DNAマーカー開発などの農畜産物のゲノム研究を大きく推進することができると期待される。我々は、農林水産省の「画期的な農畜産物作出のためのゲノム情報データベースの整備」の一環として、ウェブのGUIを通してNGSなどの大規模データを処理するためのシステムとして、ペンシルバニア州立大等が開発しているGalaxyを採用し、農業生物資源研究所におけるサービスであるGalaxy/NIASを公開、運用している(https://galaxy.dna.affrc.go.jp/)。大型ファイルのアップロードではファイルサイズに制限があるため、別途sftpで転送する経路を確保している。通常のデータ処理は高速ディスク領域で行われるが、最終処理結果は大型ストレージのバックアップ領域に保存することができる。本サービスは、農畜産物ゲノム情報データベースAgrIDの一部である(http://agrid.dna.affrc.go.jp/)。
番 号 40
タイトル SOGO: 農畜産物ゲノム研究のためのデータベース統合と解析環境の整備
発表者 土井考爾1)、ソロビヨワ・イェレナ2)、寺本由美子1)、石川友美1)、後藤明俊3)、宮尾安藝雄1)
所 属 1)農業生物資源研究所 農業生物先端ゲノム研究センター ゲノムリソースユニット 2)産業技術総合研究所 糖鎖創薬技術研究センター 3)農業・食品産業技術総合研究機構 作物研究所 稲研究領域 
要 旨 イネ等農畜産物を対象とした有用遺伝子の探索や新品種作出には、これまでに20年以上にわたって蓄積され、また次世代シーケンサーの普及によって急速に増大しつつある各種オミックスデータの活用が不可欠である。我々は2014年5月に新しいデータベース統合システム”SOGO”を公開した(https://sogo.dna.affrc.go.jp/)。本システムは、必要なデータへのアクセスと解析作業を高度な情報処理スキルを要求せずに実現し、研究過程でのデータの保護・共有・公開を容易化する機能を実装した、クラウド型のミドルウェアである。SOGO上にはポータルサイトAgrIDが構築され、農畜産物ゲノムに関する70以上のデータベースにアクセスできる。また、解析用の各種webアプリケーションが統合されている。解析対象データ・プログラム・解析結果などをまとめてサーバ側に保持できる上、データそれぞれについて秘匿・特定ユーザとの共有・公開などの設定が簡単にできる。特定の研究課題に応じた作業環境を柔軟に構築でき、データの検証や再利用も容易である。このように、SOGOは農畜産物ゲノム研究の各過程を幅広く支援する。
番 号 41
タイトル DDBJ
発表者 中村保一、神沼英里、小笠原理、有田正規、大久保公策、高木利久
所 属 情報・システム研究機構 国立遺伝学研究所 DDBJセンター
要 旨 日本DNAデータバンク(DDBJ)(http://www.ddbj.nig.ac.jp)はNCBI、EBIとともにInternational Nucleotide Sequence Database Collaboration (INSDC)を構成し塩基配列アーカイブと解析リソースの提供を実施している。INSDCでは伝統的な配列DBを中心に、新型シーケンサ由来データDBのSequence Read Archive (SRA)や、研究プロジェクトに関するBioProject DBなどを運営している。今年度、DDBJはバイオサイエンスデータベースセンターと共同で、制限アクセスを備えたヒト対象の表現型/遺伝子型解析データアーカイブである Japanese Genotype-phenotype Archive (JGA)を立ち上げたので報告する。また、今年度よりライフサイエンス統合データベースセンター(DBCLS)の一部のメンバーが遺伝研での勤務となった機会を利用し、サービス向上を目的とした連携強化を進めており、DBCLSで開発された技術の導入や共同開発の推進を実施している。その他、DDBJの進捗と展望を併せて紹介する。
番 号 42
タイトル ライフサイエンスデータの統合化を支えるITインフラ
発表者 仲里猛留
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨 ライフサイエンス統合データベースセンター(DBCLS)では、以前のプロジェクトである文部科学省委託研究開発事業「統合データベースプロジェクト」(平成18年度?22年度)の開始以降、ライフサイエンスデータの統合化と利用促進のために基盤技術開発、ポータルサイト整備、アーカイブ事業をはじめ、さまざまなサービスの開発と運用を行ってきた。当初のプロジェクト開始から年月が経ち、これらのサービスを運用するPCサーバー群も続々と機器更新の時期を迎えている。この際、コストやダウンタイムの観点から、既存・新規のデータベースや各種サービスの効率的かつ安定的な運用と拡張を行うため、他の関係機関とITインフラの一体的な運用について連携を図っている。たとえば、開発が終了したサービスに関してはNBDCに移管され運用が行われている。またDBCLSが柏に移転したのに合わせて計算機資源は遺伝研(三島)に移設することになっており、公開用データ作成のための計算処理等においてDDBJの計算機資源をさらに活用することが見込まれている。今後、ミラーやクラウドによるダウンタイムの少ない運用が行えないか検討を重ねていく予定である。
番 号 43
タイトル MBGD: 大規模比較ゲノム解析基盤としての微生物ゲノムデータベース
発表者 内山郁夫1)、千葉啓和1)、西出浩世1)、三原基広2)
所 属 1)自然科学研究機構 基礎生物学研究所 理論生物学領域  2)株式会社ダイナコム
要 旨 MBGDは多様な微生物のゲノム情報をオーソログ関係に基づいて整理し比較するためのデータベースである。MBGDでは、全系統をカバーする 「標準オーソログ表」に加えて、種、属、科などの各系統群について「系統群特異的オーソログ表」も保持しており、近縁ゲノム比較のためのリ ソースとしても効果的である。さらにMBGDでは、データベースにないゲノムデータをアップロードして解析に加える機能も持っており (MyMBGD)、様々なデータを用いた比較解析を行うことができる。一方、近年の次世代シーケンサの発展に伴い、同一種、もしくは近縁種の 多系統のゲノムが大量に決定され、ドラフト状態のデータとして公開されている。これらのデータすべてをオーソログ解析に取り込むのは適当でな いが、MBGDを用いてこれらのデータの比較解析を行えるようにすることには意味がある。そこで、ドラフトデータをMBGDに登録した上で、 MyMBGD機能を用いて動的な比較解析を行えるようにした。一方、こうした比較解析の基盤として用いるためには、標準オーソログ表の品質も 重要になってくる。MBGDのオーソログ解析手法(DomClust)は、融合タンパク質を適切に扱うためのドメイン分割処理を含んでいる が、マルチプルアライメントを用いてその精度を改善するDomRefine手続きを開発し、これを用いて標準オーソログ表の改訂も行った。こ れらMBGD最新版におけるゲノム比較解析の戦略について紹介する。