ポスター発表 (2016)

ポスター発表日程

ポスター発表は以下の日程で行います。

【10月5日(水)】
ライトニングトーク①  奇数番号 14:35 ~ 15:10
ポスター発表①     奇数番号 15:10 ~ 16:30

【10月6日(木)】
ライトニングトーク②  偶数番号 13:10 ~ 13:45
ポスター発表②     偶数番号 13:45 ~ 15:05

【発表者はこちら(ポスター様式、ポスター設置・撤去などのタイムスケジュール等)を
ご覧ください。

※ポスターや発表スライド等の著作権は、別途記載がない限り発表者・発表者の所属機関に
帰属します。
 ポスター・スライド内の図や文言を転用する際には、著作者と話し合っていただくよう
お願いいたします。



番号  代表発表者所 属タイトル
1  中村保一 情報・システム研究機構 国立遺伝学研究所
DDBJ センター
DDBJ pdf-i
2  大田達郎 情報・システム研究機構
ライフサイエンス統合データベースセンター
公共NGSデータ再利用のためのデータ整備 pdf-i
3  仲里猛留 情報・システム研究機構
ライフサイエンス統合データベースセンター
NGS技術の進展と登録データ pdf-i
4  内藤雄樹 情報・システム研究機構
ライフサイエンス統合データベースセンター
GGGenome & CRISPRdirect:ゲノム編集のオフターゲット効果を防ぐための塩基配列検索ツール pdf-i
5  坊農秀雅 情報・システム研究機構
ライフサイエンス統合データベースセンター
新規モデル生物における大量塩基配列データ利用を促進する統合環境の構築 pdf-i
6  雨宮崇之 産業技術総合研究所
創薬分子プロファイリング研究センター
経済産業省関連ライフサイエンス・ポータルサイト MEDALS pdf-i
7  八塚茂 科学技術振興機構
バイオサイエンスデータベースセンター
生命科学系データベースアーカイブ・IntegbioデータベースカタログのUPDATEとデータベース内項目調査 pdf-i
8  大波純一 科学技術振興機構
バイオサイエンスデータベースセンター
生命科学データベース横断検索の情報検索高度化に向けた取り組み pdf-i
9  畠中秀樹 科学技術振興機構
バイオサイエンスデータベースセンター
NBDCのRDFの活用に向けて pdf-i
10  川島秀一 情報・システム研究機構
ライフサイエンス統合データベースセンター
NBDC RDFポータル pdf-i
11  櫛田達矢 科学技術振興機構
バイオサイエンスデータベースセンター
JSTシソーラスの洗練化とライフサイエンス研究における有効性の検討 pdf-i
12  山本泰智 情報・システム研究機構
ライフサイエンス統合データベースセンター
RDFデータの利用性を高めるための基盤技術 pdf-i
13  山口敦子 情報・システム研究機構
ライフサイエンス統合データベースセンター
信頼性が確保されたSPARQLエンドポイントでのクエリ生成支援 pdf-i
14  片山俊明 情報・システム研究機構
ライフサイエンス統合データベースセンター
開発者会議 BioHackathon 2016 と SPARQLthon の発展 pdf-i
15  千葉啓和 自然科学研究機構 基礎生物学研究所 SPANGによるRDFデータベースの統合的利用 pdf-i
16  内山郁夫 自然科学研究機構 基礎生物学研究所 大規模な微生物ゲノムに対応したオーソログ解析手順の改良 pdf-i
17  藤澤貴智 情報・システム研究機構 国立遺伝学研究所 セマンティック・ウェブ技術を用いたCyanoBase更新系の整備 pdf-i
18  森宙史 情報・システム研究機構 国立遺伝学研究所 微生物統合データベースMicrobeDB.jp 2.0 pdf-i
19  鈴木真也 東京工業大学生命理工学院 微生物由来環境情報のRDF化による統合化 pdf-i
20  柴谷多恵子 かずさDNA研究所 植物ゲノム情報活用のための統合研究基盤の構築 pdf-i
21  中谷明弘 大阪大学大学院 医学系研究科 遺伝子オルソログDBによる植物ゲノムDBの統合 pdf-i
22  市原寿子 かずさDNA研究所 作物品種情報に対するセマンティックウェブ技術の適用 pdf-i
23  桝屋啓志 理化学研究所 バイオリソースセンター RDFを利用して実験動物の表現型と疾患との関連性を示すシステム pdf-i
24  高月照江 理化学研究所 バイオリソースセンター 生物種横断的な表現型データポータルサイトJ-phenomeについて pdf-i
25  戀津魁 理化学研究所 情報基盤センター 理研メタデータベースの運用とデータ統合の実際 pdf-i
26  神保宇嗣 国立科学博物館 動物研究部 地球規模生物多様性情報機構(GBIF):生物多様性情報の収集と活用を目指した枠組み pdf-i
27  遠里由佳子 理化学研究所 生命システム研究センター
発生動態研究チーム
SSBD:生命動態情報と細胞・発生画像情報の統合データベース開発の進展 pdf-i
28  京田耕司 理化学研究所 生命システム研究センター
発生動態研究チーム
BDML:生命現象の時空間動態に対する定量データを記述する言語 pdf-i
29  ホー・ケネス 理化学研究所 生命システム研究センター
発生動態研究チーム
SSBD:生命動態情報と細胞・発生画像情報を活用するソフトウェアの開発とその進展 pdf-i
30  小野浩雅 情報・システム研究機構
ライフサイエンス統合データベースセンター
人材育成教材ポータルサイトとしての統合TV pdf-i
31  飯田啓介 情報・システム研究機構
ライフサイエンス統合データベースセンター
日本語Webコンテンツ「新着論文レビュー」とほかのコンテンツとの連携 pdf-i
32  金進東 情報・システム研究機構
ライフサイエンス統合データベースセンター
GlycoTM - 糖鎖情報マイニングの為の文献アノテーションデータベースの構築 pdf-i
33  藤田典昭 産業技術総合研究所 糖鎖技術研究グループ 糖鎖関連の遺伝子と遺伝性疾患に関する知識ベースの開発 pdf-i
34  山田一作 野口研究所 GlyTouCan Partner:糖鎖データ連携のためのプログラム pdf-i
35  松原正陽 野口研究所 WURCSFramework ­ Glycoinformatics Library for Glycan Structure Analysis and Representation using WURCS pdf-i
36  新町大輔 創価大学 国際糖鎖構造リポジトリの”Enrichment cycle” pdf-i
37  ソロビヨワ・
   イェレナ
産業技術総合研究所 糖鎖技術研究グループ 日本糖鎖科学コンソーシアムデータベース (JCGGDB) pdf-i
38  諏訪牧子 青山学院大学 理工学部 化学・生命科学科 SEVENS-Pathway: ヒトGPCRのシグナル伝達パスウェイ解析統合環境 pdf-i
39  藤原和夫 創価大学 理工学部 蛋白質複合体データベース:OLIGAMI
40  金城玲 大阪大学 蛋白質研究所 蛋白質構造データバンク(PDBj)の高度化と統合的運用 pdf-i
41  小林直宏 大阪大学 蛋白質研究所 高度化された生体高分子NMRデータベース(PDBj-BMRB)による統合的利用 pdf-i
42  津留美智代 久留米大学 疾患プロテオミクス 疾患特異的タンパク質の統計学的探索方法 pdf-i
43  守屋勇樹 情報・システム研究機構
ライフサイエンス統合データベースセンター
jPOST: 今こんな感じです pdf-i
44  奥田修二郎 新潟大学大学院 医歯学総合研究科 jPOST: リポジトリ始めました pdf-i
45  吉沢明康 京都大学 化学研究所
バイオインフォマティクスセンター
jPOST: 再解析考え中です pdf-i
46  河野信 情報・システム研究機構
ライフサイエンス統合データベースセンター
プロテオームメタデータのRDF化 pdf-i
47  河野信 情報・システム研究機構
ライフサイエンス統合データベースセンター
日本でのBeaconサービスの提供 pdf-i
48  河野信 情報・システム研究機構
ライフサイエンス統合データベースセンター
ヒトマルチオミクスデータのRDF化と横断検索 pdf-i
49  鈴木穣 東京大学大学院 新領域創成科学研究科 疾患ヒトゲノム変異の生物学的機能注釈を目指した多階層オミクスデータの統合
Regulatory Omics Database for Analyzing Transcriptional Consequences of Human SNVs
pdf-i
50  川路英哉 理化学研究所 情報基盤センター 国際的ゲノミクスデータ統合のアジア拠点: The Asian Mirror of the UCSC Genome Browser Database pdf-i
51  澤井裕美 東京大学大学院 医学系研究科 統合化推進プログラムにおけるヒトゲノムバリエーションデータベース pdf-i
52  早野崇英 情報・システム研究機構 国立遺伝学研究所 ヒト内在性レトロウイルス由来転写調節エレメントデータベースの構築 pdf-i
53  金昭 京都大学 化学研究所 ヒト疾患に関与するウイルスゲノムのデータベース pdf-i
54  田辺麻央 京都大学 化学研究所 抗微生物薬と抗悪性腫瘍薬に対する薬剤耐性メカニズムの比較解析 pdf-i
55  冨田秀太 岡山大学大学院 医歯薬学総合研究科 Lung cancer panelを用いたマルチプレックス遺伝子変異解析と肺癌データベース pdf-i
56  川本祥子 情報・システム研究機構
ライフサイエンス統合データベースセンター
希少・未診断疾患の遺伝学的検査におけるヴァリアント意義付けとデータベース pdf-i
57  藤原豊史 株式会社インテック 文献データに基づく症例検索システムの開発 pdf-i
58  金谷重彦 奈良先端科学技術大学院大学 メタボロミクスを基盤としたエコロジーとヘルスケア・インフォマティクス pdf-i
59  大倉政宏 希少疾患難病連絡会 省みられない希少難病情報の国内での活用に向けて pdf-i
60  坂手龍一 医薬基盤・健康・栄養研究所 創薬・疾患研究のための情報体系構築~ 基礎研究から臨床試験まで ~ pdf-i
61  森田瑞樹 岡山大学 がん個別化医療における診療支援のための情報共有に向けた提案 pdf-i
62  陳怡安 医薬基盤・健康・栄養研究所
バイオインフォマティクスプロジェクト
統合データウェアハウスTargetMineの高度化とデータ解析ツール pdf-i
63  五十嵐芳暢 医薬基盤・健康・栄養研究所 トキシコゲノミクス・インフォマティクスプロジェクト 創薬・疾患研究のためのデータベース検索システム Sagace pdf-i



ポスター発表詳細(ポスター情報)




番 号 1
タイトル DDBJ
発表者 〇中村保一、神沼英里、小笠原理、有田正規、大久保公策、高木利久
所 属 情報・システム研究機構 国立遺伝学研究所 DDBJ センター
要 旨  DDBJ (http://www.ddbj.nig.ac.jp) は米国 NCBI, 欧州EBIとの国際共同事業である International Nucleotide Sequence Database Collaboration (INSDC) のパートナーとして、塩基配列 DB ならびにその解析リソースを維持するとともに、遺伝研スーパーコンピュータの運営を担当し、データアーカイブとその解析系の提供を行っている。INSDC では伝統的な配列 DB (Traditional INSDC DB) の他、新型シーケンサ由来データ DB の DDBJ Sequence Read Archive (DRA) や、研究プロジェクトに関する BioProject DB、サンプルに関する BioSample DB、ヒトの表現型/遺伝子型 DB である Japanese Genotype-phenotype Archive (JGA) をNBDCと共同で運営している。諸事情から開発が停止していたオミックス DB の立ち上げ状況など、DDBJ の運営についての進捗と展望・諸問題について報告する。
発表資料  pdf-i    doi:10.18908/togo2016.p001
番 号 2
タイトル 公共NGSデータ再利用のためのデータ整備
発表者 ○大田達郎1)、沖真弥2)、川上英良3)、仲里猛留1)、坊農秀雅1)
所 属 1)ライフサイエンス統合データベースセンター 2)九州大学大学院 医学系研究科 発生再生医学分野
3)理化学研究所 医科学イノベーションハブ推進プログラム 疾患機序研究グループ
要 旨  DBCLSではこれまでに超並列シーケンサ(NGS)から得られたデータの公開と再利用を促進するため、公共NGSデータベースのメタデータの整備やそれに基づく検索エンジンの開発などを進めてきた。これらの既存サービスを維持すると共に、DBCLSでは一般の生命科学研究者にとってのデータの再利用をさらに容易にするため、公共DBに登録された一次データを解析し、その結果のデータへのアクセスおよびデータに基づく解析サービスの提供を行っている。本発表では、既存提供サービスの発展としてNGSデータのクオリティデータベースのRDF化、および新たな公共データの応用としてChIP-Seqデータを再利用するためのサービスである2つのサービス、九州大学と連携して開発したChIP-Atlasと、理化学研究所との連携で開発したwPGSA onlineについて紹介する。
発表資料  pdf-i    doi:10.18908/togo2016.p002
番 号 3
タイトル NGS技術の進展と登録データ
発表者 ○仲里猛留、大田達郎、坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  超並列シーケンサ(NGS)は今や生命科学分野で必要不可欠な技術となっており、その公共データベースであるSequence Read Archive (SRA) も登場から10年近くが経過した現在は3500兆塩基対(≒3.5PB)のデータを収載するまでに成長した。DBCLSではこのような大規模データの取扱いに早くから注目し、効率良い再利用のために目次サイトであるDBCLS SRA (http://sra.dbcls.jp/)の構築・運用を行ってきた。DBCLS SRAでは、目的や機器、生物種別に登録データを検索することが可能である。加えて疾患からの検索、非モデル生物種データの検索機能も充実させた。また、2010年より登録件数の推移を統計情報として公開しており、NGS機器の栄枯盛衰を垣間見ることができる。最近は、遺伝子発現データがGEOにも登録されるなど、他のデータベースにもまたがる登録が増えており、それらを横断的に検索するためDDBJと協力してプロジェクトやサンプルのデータベースであるBioProjectやBioSampleとの連携を進めている。
発表資料  pdf-i    doi:10.18908/togo2016.p003
番 号 4
タイトル GGGenome & CRISPRdirect:ゲノム編集のオフターゲット効果を防ぐための塩基配列検索ツール
発表者 〇内藤雄樹、坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  CRISPR/Cas9ゲノム編集法は、ゲノムの任意の部位を編集することのできる技術として近年急速に普及している。しかし、標的以外の部位に意図せずゲノム編集が起こってしまうオフターゲット効果を防ぐことや、塩基配列のノックインなど標的配列に制約のあるゲノム編集を行うためのガイドRNA設計は必ずしも容易でない。そのようなガイドRNA設計を支援するウェブツールとして、我々が公開している高速塩基配列検索GGGenome (http://GGGenome.dbcls.jp/) および、CRISPR/Cas9ゲノム編集法のためのガイドRNA設計ソフトウェアCRISPRdirect (http://crispr.dbcls.jp/) を紹介する。本年のアップデートでは、ゲノムが公開されている200種類以上の生物種に対応したほか、近年のCRISPR/Cas9法の改良をふまえ、NGG以外のPAM配列を認識するCas9のためのガイドRNA設計も簡便に行えるようにした。
発表資料  pdf-i    doi:10.18908/togo2016.p004
番 号 5
タイトル 新規モデル生物における大量塩基配列データ利用を促進する統合環境の構築
発表者 〇坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  DBCLSの一部のグループが2014年度から国立遺伝学研究所に活動の場を移し、国際塩基配列データベースを運営しているDDBJの隣で連携を深めつつ、DDBJにある大量塩基配列データを活用しやすくするための研究開発を推進している。
これまで非モデル生物と呼ばれてきた新規モデル生物は、ゲノム配列や遺伝子のリファレンス情報に乏しく、次世代シークエンサーによる配列解析が困難である。そこで、データベース再利用研究の対象として、新規モデル生物のハダカデバネズミ(Heterocephalus glaber)とマウスや、カイコ(Bombyxmori)とヒトのトランスクリプトーム種間比較解析を検討した。それらを実現する「環境」の構築に関して報告する。

[1] Miyawaki S et al. Nature Communications 7:11471 (2016) doi: 10.1038/ncomms11471
[2] Tabunoki H et al. Drug Discoveries & Therapeutics 10(1): 3-8. (2016) doi: 10.5582/ddt.2016.01011
発表資料  pdf-i    doi:10.18908/togo2016.p005
番 号 6
タイトル 経済産業省関連ライフサイエンス・ポータルサイト MEDALS
発表者 ○雨宮崇之、福西快文、堀本勝久、福井一彦
所 属 産業技術総合研究所 創薬分子プロファイリング研究センター
要 旨  経済産業省の研究機関である産業技術総合研究所では、省庁間での生命科学系データベースの統合に向けてポータルサイトであるMEDALSの運用を行っている。連携事業として、便覧のアップデート、横断検索へのデータ付加、DBのアーカイブ化を行いNBDCに提供し公開している。また本年度はMEDALS内部や解析ツールに関するオントロジー作成に取り組んでいる。加えて、情報統合DBサイトとして公開してきた解析ワークフローに関するサービスをMEDALSの活動に取り入れ、産総研内での統合化を実施している。この解析サービスではデータベースのRDF化に伴い、開発した高度な解析ツール群を広く利用可能とするために、セマンティック技術に対応したフレームワークを用い、オントロジーを利用したサービスを目指している。
発表資料  pdf-i    doi:10.18908/togo2016.p006
番 号 7
タイトル 生命科学系データベースアーカイブ・IntegbioデータベースカタログのUPDATEとデータベース内項目調査
発表者 ○八塚茂1)、信定知江1)、大久保克彦2)、井上圭介3)、加藤健弘2)、宮崎敦子1)、畠中秀樹1)
所 属 1)科学技術振興機構 バイオサイエンスデータベースセンター 2)株式会社日立製作所 3)株式会社日立公共システム
要 旨  生命科学系データベースアーカイブ (http://dbarchive.biosciencedbc.jp/) は、国内で産生された生命科学のデータをダウンロード可能な形で長期間維持するサービスであり、115 件を超えるデータベース(DB)が登録されている。2016年においては以下のUPDATEを行った。
・データベース/データメタデータの詳細検索機能を追加
・データベース/データメタデータのエクスポート機能を追加
・全てのデータベース/データにDOI(Digital Object Identifier)を付与
・データベースメタデータにおいて、研究者情報(ORCID, researchmap)・文献情報(pubmed, J-GLOBAL)・プロジェクト情報(生命科学系主要プロジェクト一覧、J-GLOBAL)へのリンクを付与

 Integbioデータベースカタログ (http://integbio.jp/dbcatalog) は文科省・厚労省・農水省・経産省の連携のもと主に国内の生命科学系DBの所在と概要を提供するサービスとして始まり、現在国内外の生命科学系DB情報約1570件を集積している。新たにデータの一括ダウンロードサイト情報と統合TVへのリンクを付加し、国外DB情報収集への注力など内容の充実も図っている。また、本カタログに収録されたDB情報を元にDB内のデータ項目調査を行った。これは目的データを含むDBの探索がより容易になるだけでなく、DB統合化における基礎情報となることが期待される。
発表資料  pdf-i    doi:10.18908/togo2016.p007
番 号 8
タイトル 生命科学データベース横断検索の情報検索高度化に向けた取り組み
発表者 ○大波純一1)、杉崎太一朗2)、坂本麗2)、平井信一2)、牧口大旭2)、川本祥子3)、畠中秀樹1)
所 属 1)科学技術振興機構 バイオサイエンスデータベースセンター 2)三井情報株式会社 
3)情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  バイオサイエンスデータベースセンター(NBDC)では、生命科学分野のデータベースエントリを文字列一致で検索する基盤として「生命科学データベース横断検索」を公開している。本サービスでは592件のデータベースサイト、64,000,000件以上のエントリを検索対象としており、該当分野の研究者や学生に広く利用されている。検索インデックスは医薬基盤・健康・栄養研究所、農業・食品産業技術総合研究機構、産業技術総合研究所の創薬分子プロファイリング研究センター、産業技術総合研究所の創薬基盤研究部門と協調し、追加と更新を行っている。2016年5月に検索エンジンの刷新とインデックス構成の変更を行い、パフォーマンス向上施策とした。さらにセマンティックな検索結果の需要に対応するため、検索利用者の検索意図を汲み取るクエリ分析を新たに取り入れることと、搭載インデックスのRDF化について検討した。また15の大学附属図書館から新しくリンクを設置いただき、利用拡大に努めている。
発表資料  pdf-i    doi:10.18908/togo2016.p008
番 号 9
タイトル NBDCのRDFの活用に向けて
発表者 ○畠中秀樹1)、大久保克彦2)、井上圭介3)、加藤健弘2)、信定知江1)、八塚茂1)
所 属 1)科学技術振興機構 バイオサイエンスデータベースセンター 2)株式会社日立製作所 3)株式会社日立公共システム
要 旨  バイオサイエンスデータベースセンター(NBDC)は昨年11月にNBDC RDFポータルを公開し、アーカイブ、HOWDY-R/TogoProtと併せ、3つの大きなRDFストアを有している。これらにSPARQL Builder、LODQA、TogoTableを適用し活用するため、RDFストアの各種整備を進めている。
 アーカイブのRDFストアはTogoDBの表形式データを自動RDF化して収納している。各種DBのIDをidentifiers.orgやEDAMオントロジーでURI化・クラス定義し、既にSPARQL Builderを適用できているが、改修したTogoDBにより、他のカラムを用いたラベルの付与やクラス定義の追加を進める予定である。
 一方HOWDY-R/TogoProtのRDFストアは、Bio2RDFを利用して得たヒト遺伝子関連RDFと、UniProtと蛋白質関連DBを紐付けるRDFを収納しており、こちらもIDのURI化やクラス定義を行ったので、上記3アプリケーションの活用に向けてさらに整備を進めたい。
発表資料  pdf-i    doi:10.18908/togo2016.p009
番 号 10
タイトル NBDC RDFポータル
発表者 ◯川島秀一
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  生命科学では細菌からヒトまで非常に多様な対象が研究されており、それぞれの研究で得られたデータや知識はデータベース化され、その後の研究に不可欠な資源として活用されている。しかし、生命科学の多種多様なデータベースは、それぞれ暗黙の前提の上に、異なる語彙、異なる形式により記述されており、そのことがデータを関連付けて利用する際の妨げになっている。もし、多種多様なデータを共通の語彙と形式を用いて記述することにより、連携させて扱うことができれば、コンピューターによるデータの解釈も一意に定まり、複雑な生命科学の問題に対して効率のよい検索を行うことができるようになる。
 JSTバイオサイエンスデータベースセンター(NBDC)と情報・システム研究機構 ライフサイエンス統合データベースセンター(DBCLS)は、生命科学分野のデータをRDF形式により記述する利点を重要視し、データベースを開発している国内外の研究グループに対しその採用を推奨してきた。また、データの利用者が、国内で開発されたRDFをデータを容易に検索・取得できるサービスの開発を開始し、2015年11月よりNBDC RDFポータルとして公開した。本ポータル開発以前に、DBCLSでは、データを統合して利用するという観点において、よいRDFデータを作成するためのガイドラインを策定し公開してきた。本ポータルサイトに登録されているRDFデータは、予め本ガイドラインを踏まえてレビューされたものに限られており、全て一定以上の品質を備えている。本ポータルから取得できるRDFデータを利用することで、異なるデータベース由来のデータを連携したアプリケーション開発や分野横断的なデータ解析等が、著しく促進されると期待される。さらに、コンピューターを利用したデータの解釈も一意に定まり、複雑な生命科学の問題に対して、近年大きな技術革新のみられる人工知能技術などを応用することも可能になると考えている。
発表資料  pdf-i    doi:10.18908/togo2016.p010
番 号 11
タイトル JSTシソーラスの洗練化とライフサイエンス研究における有効性の検討
発表者 〇櫛田達矢1)、建石由佳1)、増田壮志2)、渡邊勝太郎3)、松邑勝治3)、川村隆浩3)、古崎晃司2)
所 属 1)科学技術振興機構 バイサイエンスデータベースセンター 2)大阪大学 産業科学研究所 
3)科学技術振興機構 情報分析室
要 旨  JSTシソーラスのライフサイエンス分野の概念を対象に、4名のライフサイエンスの専門家が概念間の関係を表すRT(related term,関連語)を31種類に細分類し、SIO_000225 (hasfunction)などの標準的なオントロジー用語を割り当てた。この標準的なオントロジー用語を用いたJSTシソーラス(洗練化したJSTシソーラス)のRDFを作成、トリプルストアに格納、SPARQL検索を実行できる環境を整備し、洗練化したJSTシソーラスと他のオントロジー、シソーラスとの比較、およびライフサイエンス研究における有効性の検証を行った。その結果、このJSTシソーラスが、MeSH等と異なり、生理学的現象(例、血小板凝集)と疾患(例、血栓梗塞症)の間の直接的な関係(例、xkos:precedes)を持っており、GeneOntologyなど他のオントロジーやシソーラスと統合する際のハブとして機能すること、またこれらをマッシュアップしたデータに対して、洗練化したJSTシソーラスの推論を用いて血栓梗塞症の関連遺伝子を効率的に見つけることを確認した。
発表資料  pdf-i    doi:10.18908/togo2016.p011
番 号 12
タイトル RDFデータの利用性を高めるための基盤技術
発表者 ○山本泰智、山口敦子
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  近年生命科学分野において多様なデータへの統一的なアクセス方法を提供するためにRDFを用いるデータベースが増えつつある。様々な機関や組織が自由にデータを公開し、ウェブオブデータの仕組みを利用して互いに参照し合うことで人だけでなく、機械による統合的なアクセス性が飛躍的に高まりうる。しかし、この利点を最大限に機能させるためには各データ提供サービスの信頼性や納められているデータの構造を広く共有できる環境が必要になる。そこでライフサイエンス統合データベースセンターでは予め指定した一連のSPARQLエンドポイントに対して定期的にこのようなデータを取得して公開するシステムを開発している。ポスターでは現状と課題、今後の予定を紹介する。
発表資料  pdf-i    doi:10.18908/togo2016.p012
番 号 13
タイトル 信頼性が確保されたSPARQLエンドポイントでのクエリ生成支援
発表者 ○山口敦子1)、山本泰智1)、古崎晃司2)、戀津魁3)、桝屋啓志3)、小林紀郎3)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター 2)大阪大学 3)理化学研究所
要 旨  SPARQL Builderは、SPARQL言語の知識がなくとも,また,対象データセットの構造を知らなくても,クラス間関係提示を用いた対話的なGUIを介してSPARQLクエリを生成することができるウェブ上のサービスである。ユーザは対象データセットやそのデータセットを提供するSPARQLエンドポイントに対して、知識を持たないことを前提にしているため、システム側で適切なデータセットやSPARQLエンドポイントを利用するよう、ユーザを誘導する必要がある。それを実現するため、SPARQLエンドポイントの信頼性評価システム UmakaData と連携し、UmakaDataに蓄積されたメタデータを利用して、信頼性が確保されたSPARQLエンドポイントのみのデータを利用するSPARQL Builderシステムの構築を試みた。具体的にはUmakaDataのメタデータからSPARQL Builder に特に必要となる項目を抜き出し、それらの項目のスコアでSPARQLエンドポイントリストを切り出して利用した。構築されたシステムを紹介すると共に、構築の際に得られた知見についても議論する。
発表資料  pdf-i    doi:10.18908/togo2016.p013
番 号 14
タイトル 開発者会議 BioHackathon 2016 と SPARQLthon の発展
発表者 ○片山俊明
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  バイオサイエンスデータベースセンター(NBDC)とライフサイエンス統合データベースセンター(DBCLS)では、データベースの統合に関わる最先端の技術開発を行う国際開発者会議BioHackathonを2008年から開催してきた。第9回目となる今年は、慶應義塾大学先端生命科学研究所の協力のもと鶴岡市内で開催し、生命科学の根幹をなすゲノム情報と増大するオミックスデータの統合的な利用を実現するため、セマンティック・ウェブによる最先端のデータベース技術開発を継続して行った。また、これらの技術を国内でも活用するため、DBCLSでは毎月SPARQLthonという会議を開催しており、さまざまなデータベース開発者の技術交流を促進している。ここでは、BioHackathonとSPARQLthonにおける開発成果を概観し、DBCLSにおける関連サービスの開発状況について進展を報告する。
発表資料  pdf-i    doi:10.18908/togo2016.p014
番 号 15
タイトル SPANGによるRDFデータベースの統合的利用
発表者 ○千葉啓和、内山郁夫
所 属 自然科学研究機構 基礎生物学研究所
要 旨  生物情報データベースの相互運用性を高めるため、これまで多くのデータベースのRDF化が進められてきた。こうした基盤を利用し、強力なクエリ言語SPARQLを活用すれば、RDFデータの検索および統合が可能である。しかしながら、SPARQLを直接記述することは、多くの生物系研究者にとっては負担となる作業である。そこで我々は、RDFの活用を容易にするための新しいクライアントSPANGを開発した。SPANGを用いることで、簡単なSPARQLクエリによる問い合わせを容易に行うことができる。より複雑な構造を持つクエリに関しては、これまでに作成されたSPARQLのテンプレートを再利用して問い合わせを実行することが可能である。さらに、別々のデータベースに対するクエリを組み合わせ、複数のデータベースを統合的に利用する問い合わせを実行することもできる。このように、SPANGは、RDFへの問い合わせに必要な労力を減らすとともに、RDFの利用を促進する機能を備えている。SPANGを活用することで、分散したRDFデータベースの統合的利用および知識発見が促されると考えられる。
発表資料  pdf-i    doi:10.18908/togo2016.p015
番 号 16
タイトル 大規模な微生物ゲノムに対応したオーソログ解析手順の改良
発表者 ○内山郁夫1)、三原基広2)、西出浩世1)、千葉啓和1)
所 属 1)自然科学研究機構 基礎生物学研究所 2)株式会社ダイナコム
要 旨  微生物比較ゲノムデータベースMBGDは、爆発的な増大を続ける微生物のゲノム・メタゲノムデータを整理する基盤として、既知の微生物ゲノム間のオーソログデータの構築を行っている。従来のMBGDでは、ゲノム間の総当たりのホモロジー検索結果を保持しつつ、属当たり1つの代表生物種をとって比較したものを標準オーソログテーブルとして、また各種内や属内についてはそれぞれ個別にオーソログ解析を行ったものを系統特異的オーソログテーブルとして提供してきた。しかし、ゲノム数の急激な増加によって総当たりのホモロジー検索結果の維持が困難になってきており、また上記手順では種内や属内で保存されていない遺伝子が全体比較の対照から漏れるという問題が残っていた。そこで、これらのオーソログテーブルを統合して漏れのない標準オーソログテーブルを作成する手順を新たに作成した。具体的には種間ゲノム比較で得られた遺伝子レパートリー(パンゲノム)を種ゲノムとして属間比較を行い、そこで得られたパンゲノムを属ゲノムとして標準オーソログテーブルの作成を行う。ホモロジー検索も、この手続きに必要な範囲で行うようにして、計算量の削減を図った。
発表資料  pdf-i    doi:10.18908/togo2016.p016
番 号 17
タイトル セマンティック・ウェブ技術を用いたCyanoBase更新系の整備
発表者 ○藤澤貴智、中村保一
所 属 情報・システム研究機構 国立遺伝学研究所
要 旨  CyanoBase (http://genome.microbedb.jp/cyanobase/) は、1996年、かずさDNA研究所において開発され、その後、ラン藻を中心とする光合成関連微生物のゲノムスケールのデータ追加・更新が手動によりデータ拡張されてきた。また、データベースへの機能追加およびシアノバクテリア研究者によって提供された遺伝子破壊株情報およびキュレーターによってラン藻遺伝子に関する文献リファレンス情報が集積され、主に遺伝子に関連するアノテーションデータが拡張されてきたが、2011年7月、国立遺伝学研究所への移管後、ゲノムエントリー追加が未対応な状況であった。
 CyanoBase20周年を迎える2016年において、ゲノムエントリー追加についてデータ変換・投入の更新系を整備することにより、ドラフトゲノムを含む374のゲノム情報を追加・拡充した。本発表においては、シアノバクテリアゲノムプロジェクトの取得などセマンティック・ウェブ技術の利用を中心に発表する。
発表資料  pdf-i    doi:10.18908/togo2016.p017
番 号 18
タイトル 微生物統合データベースMicrobeDB.jp 2.0
発表者 ○森宙史1)、藤澤貴智1)、千葉啓和3)、鈴木真也2)、山本希2)、内山郁夫3)、菅原秀明1)、中村保一1)、黒川顕1),2)、MicrobeDB.jpプロジェクトチーム1),2),3)
所 属 1)情報・システム研究機構 国立遺伝学研究所 2)東京工業大学 生命理工学院 3)自然科学研究機構 基礎生物学研究所
要 旨  微生物は発酵や抗生物質生産、感染症など様々な人間活動に深く関わっているため研究の歴史も古く、蓄積されたデータや知識は膨大かつ多様である。さらにゲノムやメタゲノムなどの大規模データも多数産出されているため、これらを横断的かつ簡便に利用出来れば、新たな仮説の創出がより容易になると期待できる。我々は、国内外に散在する細菌の各種オミックス情報を広く収集し、遺伝子、ゲノム、環境の3つの軸に沿って様々な知識を整理し、ゲノム情報を核としてセマンティックウェブ技術により統合した統合データベース「MicrobeDB.jp」をこれまで開発してきた。本発表では、ゲノムやメタゲノム等のデータを大幅に追加すると同時に種々のオントロジーを更新し、統合DBを用いた様々な解析結果を提示するアプリケーション群やユーザナビゲーションシステムによって、超高度化されたMicrobeDB.jp 2.0の詳細について、発表する。MicrobeDB.jpのWebサイト: http://microbedb.jp/MDB/
発表資料  pdf-i    doi:10.18908/togo2016.p018
番 号 19
タイトル 微生物由来環境情報のRDF化による統合化
発表者 ○鈴木真也1)、山本希1)、森宙史2)、黒川顕1),2)
所 属 1)東京工業大学 生命理工学院 2)情報・システム研究機構 国立遺伝学研究所
要 旨  微生物は地球上の至る所に存在し、多種多様な機能を担っている。個々の微生物が担う機能と環境との関連性は、メタゲノム解析等によって盛んに研究され、その成果は塩基配列データおよび付随するメタデータとして公開されている。しかし研究者ごとに微生物の由来環境を記述する語彙や様式が異なる問題点があり、データの横断的な検索・利用が困難であった。
 本研究ではまず、公共の塩基配列データベースに登録された微生物の由来環境を取得・整理することで微生物の環境を統一的に記述するための基盤を構築した。具体的には、生息環境についての語彙(例:soil, gut)を纏めた微生物環境オントロジー(MEO)、そして主に数値データで表される生息環境の状態(例:温度、pH)を詳細に記述する微生物採集語彙(MSV)を構築した。これらの基盤を用いることで、データ統合化を実現することが可能になった。
 オントロジーを構築すると同時に、我々は機械学習と自然言語処理を用いてデータへのオントロジーのアノテーション付けを自動的に行なうシステムを開発し、実際にこれを適応した。本ポスター発表では以上の取り組みの成果を報告する。
発表資料  pdf-i    doi:10.18908/togo2016.p019
番 号 20
タイトル 植物ゲノム情報活用のための統合研究基盤の構築
発表者 ○柴谷多恵子1)、市原寿子1)、白澤沙知子1)、中村保一1)、中谷明弘2)、浅水恵理香3)、平川英樹1)、田畑哲之1)
所 属 1)かずさDNA研究所 2)大阪大学大学院 医学系研究科 3)龍谷大学 農学部
要 旨  我々は、国内外に散在する多様な植物ゲノム関連情報を集約・整備した情報基盤として、ポータルサイトPlant Genome DataBase Japan (PGDBj、http://pgdbj.jp) を提供している。PGDBjのDBの内、リソースDBでは、理化学研究所BRCが開発した植物遺伝子の串刺し検索システムSABRE2 (http://sabre.epd.brc.riken.jp/SABRE2.html) を拡充し、BRCおよびNBRPに由来する情報とPGDBjで整備した情報、計17植物種の約220万件を対象とした横断検索システムを公開している。また、DNAマーカーDBでは、62植物種の約20万件のマーカー情報、42植物種の約6800件のQTL情報を公開している。整備したこれらの情報の実用化利用の足掛かりとして、育種に特化したDNAマーカーの検索システムも新たに構築し、公開した。現在、各DBエントリーをRDF化し、その構造に基づく横断検索システム及びゲノムブラウザJBrowseを介して検索結果を提示するシステムの構築を進めており、これらの情報のさらなる有効利用を実現する基盤を提供する予定である。
発表資料  pdf-i    doi:10.18908/togo2016.p020
番 号 21
タイトル 遺伝子オルソログDBによる植物ゲノムDBの統合
発表者 ○中谷明弘1)、市原寿子2)、柴谷多恵子2)、白澤沙知子2)、中村保一2)、浅水恵理香3)、平川英樹2)、田畑哲之2)
所 属 1)大阪大学大学院 医学系研究科  2)かずさDNA研究所 3)龍谷大学 農学部
要 旨  配列の類似したアミノ酸配列(遺伝子)の種間の対応関係をオルソログと定義し、緑色植物とラン藻のオルソログ情報をPGDBjオルソログDB (Plant Genome DataBase Japan, Ortholog Database;http://pgdbj.jp/od3/) として公開しています。遺伝子の名前や染色体上での位置の他に機能注釈中のキーワードや配列自体をクエリとした検索が可能になっています。また、オルソログ関係にある遺伝子の並び順を生物種間で保存している染色体領域(シンテニー様領域)の情報を用いて、遺伝子やDNAマーカーの生物種横断的な対応関係の推定や探索も可能になっています。これまでに、NCBI RefSeq (Release 75)から取得した緑色植物のアミノ酸配列(64種・約230万配列)とラン藻のアミノ酸配列(231種・約86万配列)を対象として、両系統群内での全アミノ酸配列間のBLASTによる配列相同性の算出、および、それに基づいた全アミノ酸配列の分類を行い、オルソログ情報の生成およびデータベース化を完了しています。計算機処理用データのダウンロードも可能になっています。
発表資料  pdf-i    doi:10.18908/togo2016.p021
番 号 22
タイトル 作物品種情報に対するセマンティックウェブ技術の適用
発表者 ○市原寿子1)、藤井浩2)、櫛田達矢3)、田畑哲之1)
所 属 1)かずさDNA研究所 2)農研機構 果樹茶業研究部門 3)科学技術振興機構 バイオサイエンスデータベースセンター
要 旨  「植物ゲノム情報活用のための統合研究基盤の構築」では、従来のウェブ技術に加え、セマンティックウェブ技術(以下SWT)を用いた植物関連情報の統合を試みており、ゲノム関連情報を対象の中心としたデータベース統合の他、作物品種の形質情報へSWTを適用したシステム構築を実施している。本発表では、農林水産省品種登録ホームページ (http://www.hinsyu.maff.go.jp/) から公開されている情報を用いて、「作物品種の系統情報」や「有用農業形質の品種間での比較や分離に関わる情報」の検索を効率化するシステムの構築について報告する。このシステムではSWTによりリンクした多様な情報に基づき、多数の条件を複雑に組み合わせた検索が可能となり、「品種名」から「その品種が保有する農業形質」の情報、または「農業形質名」から「品種」や「系統」に関わる情報を抽出することができる。例えば検証した作物のうち、リンゴにおいては、種子親を‘ふじ’とする多数の品種の果汁糖度の情報の一括抽出や、品種‘夏緑’の情報から、種子親である‘きたかみ’の更にその種子親として、品種名‘東北2号'の自動抽出に成功した。
発表資料  pdf-i    doi:10.18908/togo2016.p022
番 号 23
タイトル RDFを利用して実験動物の表現型と疾患との関連性を示すシステム
発表者 熊谷禎洋1)、高月照江2)、斎藤実香子2)、高山英紀2)、○桝屋啓志2)
所 属 1)株式会社日立製作所 医療情報ソリューション部 2)理化学研究所 バイオリソースセンター
要 旨  疾患の原因解明や治療法開発において、動物モデルは極めて重要な役割を果たしている。例えば、遺伝子の関与が大きいと言われる希少疾患の原因解明では、変異動物が示す表現型と原因遺伝子の情報の貢献が大きい。疾患研究の現場において、より多くの実験動物の情報、特に表現型データが提供されることが求められている。
 統合化推進プログラム「生命と環境のフェノーム統合データベース」では、国内のデータベースより表現型データを収集し、Resource Description Framework (RDF)の技術を用いて統合化し、ポータルサイト、J-Phenome (http://jphenome.jp) をより利用できるようにしている。我々は、J-phenomeのデータと、複数の生物の表現型の同等性を示すUberPhenoオントロジーを用いて、RDF化した表現型データ間の同等性、及び疾患との関連を示すためのアプリケーションを試作したので紹介する。疾患名、表現型、器官組織名の入力から、研究分野の語彙の違いを超えて対応する疾患モデル動物の検索が可能である。
発表資料  pdf-i    doi:10.18908/togo2016.p023
番 号 24
タイトル 生物種横断的な表現型データポータルサイトJ-phenomeについて
発表者 ○高月照江1)、斎藤実香子1)、高山英紀1)、大島和也1)、田中信彦1)、熊谷禎洋2)、桝屋啓志1)
所 属 1)理化学研究所 バイオリソースセンター 2)株式会社日立製作所 医療情報ソリューション部
要 旨  我々は、遺伝子の多様性の結果として現れる生物の表現型情報を、モデル動物(マウス、ラット、ゼブラフィッシュ、メダカ)、ゲノム編集研究など、幅広い研究コミュニティから収集し、公開する目的で表現型ポータルサイトJ-phenome (http://jphenome.info/) を作成した。
 各研究コミュニティで表現型を扱うデータベースからデータ提供を受け、提供元のデータベース単位で、個別の二次的なメタデータのデータベースとして管理を行っている。全ての表現型データは、各分野で標準的に使われている表現型のオントロジーを用いてアノテーションを行ない、統一したスキーマでRDF形式にすることで、個別DBでありながら、すべてのデータを横断的に検索できるようにした。また、MicrobeDB (http://mdb.bio.titech.ac.jp/) 、及びMornarch Initiative (https://monarchinitiative.org/) とのデータ連携も可能となり、従来より情報を広く流通させることができる見込みである。
 現在J-phenomeでは、マウス(約6000系統)、細胞(約3800株)、微生物(約15000系統)、ラット(170系統)メダカ(298系統)を公開し、全て自由にダウンロード可能である。我々は、J-phnomeから発信される表現型情報の利用を通して、各種実験動物の疾患研究への利用を始め、幅広い研究への貢献を目指している。
発表資料  pdf-i    doi:10.18908/togo2016.p024
番 号 25
タイトル 理研メタデータベースの運用とデータ統合の実際
発表者 ○戀津魁1)、桝屋啓志1),2)、小林紀郎1),2),3)
所 属 1)理化学研究所 情報基盤センター 2)理化学研究所 バイオリソースセンター 
3)理化学研究所 ライフサイエンス技術基盤研究センター
要 旨  理化学研究所は物理、化学、ライフサイエンスをはじめとするサイエンスの総合研究所であり、多種多様な研究データを産出している。これらのデータを公開するために、理研メタデータベース (http://metadb.riken.jp/) を構築し、公開インフラとして利用している。
 理研メタデータベースは、メタデータ公開の標準仕様であるResource Description Framework (RDF)に準拠して設計されており、複数のデータベースを統合、公開することができる。一つのデータベースは1つのRDF Graphとして管理され、更にデータレコード(RDFリソース)はすべてクラス概念を付してまとめ上げることで、ライフサイエンス分野でよく使われている互いに関連するテーブル形式のデータ構造を持たせ、表示することができる。RDFの特性を活用し、従来のテーブルデータとは異なり、異なるデータベースのデータも統合しつつテーブルの上に表示することが可能となっている。
 理研メタデータベースはSPARQLエンドポイント機能も備わっており、ユーザーはテーブル形式で表示されるデータ構造を参考にしながらSPARQLクエリを記述し、より詳細なデータ解析を行うことができる。
 2016年7月現在、センター横断的に110個のデータベースが統合され、クラス数2119、トリプル数152784620に及ぶデータを公開している。
発表資料  pdf-i    doi:10.18908/togo2016.p025
番 号 26
タイトル 地球規模生物多様性情報機構(GBIF):生物多様性情報の収集と活用を目指した枠組み
発表者 ○神保宇嗣1)、福田知子2)、細矢剛2)
所 属 1)国立科学博物館 動物研究部 2)国立科学博物館 標本資料センター
要 旨  生物多様性情報とは、生物の多様性、特に種レベルの多様性に関する情報である。その核になる情報は、種名をはじめとした分類群名に関する情報と、各種がいつどこで確認できたかという分布に関する情報である。地球規模生物多様性情報機構(GBIF)は、生物多様性情報の世界的な共有と活用を目的とした国際的な取り組みであり、2016年7月現在で160万件の分類群名情報と6億5千万件の分布情報を収集している。日本の活動は、GBIF日本ノードが担当しており、国内に存在する生物多様性情報の収集と発信および普及活動を行っている。また、GBIFアジア地域ノードによって、アジアにおける様々な生物多様性情報の発信と共有に関する課題に取り組んでいる。最近、GBIFでは情報のさらなる活用を目指して、1) 情報インフラの整備、2) 生態観測情報など新しいリソースへの対応、3) オープンライセンスへの対応とデータへのDOI付与などを行っており、日本国内では特にオープンデータ化に関する様々な普及活動とライセンスの移行を進めている。本発表ではこれらGBIFの概要および最近の活動について紹介する。
発表資料  pdf-i    doi:10.18908/togo2016.p026
番 号 27
タイトル SSBD:生命動態情報と細胞・発生画像情報の統合データベース開発の進展
発表者 ○遠里由佳子、ホー・ケネス、京田耕司、大浪修一
所 属 理化学研究所 生命システム研究センター 発生動態研究チーム
要 旨  画像処理を伴う生細胞イメージングや、シミュレーションを伴うモデリングの結果として、分子や細胞、個体などの生命現象の時空間情報を数値として含む定量データが産出されている。しかし、それらのデータは、インターネット上に散在しており、データの再利用を促進する上で、その集約化が課題となっていた。そこで我々は、定量データを格納・共有する、生命動態システム科学の統合データベースSSBD (Systems Science of Biological Dynamics database; http://ssbd.qbic.riken.jp) を構築した(Tohsato et al. Bioinformatics, accepted)。さらに2015年4月より、定量化が求められる画像データの格納と共有も開始している。SSBDの定量データや画像データのメタ情報は、RDF形式で RIKEN メタデータベースや NBDC RDFポータルに共有されており、SPARQLにより複数のデータベースを横断的に検索できる。本ポスターでは、それら生命動態情報と細胞・発生画像情報に関するデータベース開発の進展を報告する。
発表資料  pdf-i    doi:10.18908/togo2016.p027
番 号 28
タイトル BDML:生命現象の時空間動態に対する定量データを記述する言語
発表者 ○京田耕司、遠里由佳子、ホー・ケネス、大浪修一
所 属 理化学研究所 生命システム研究センター 発生動態研究チーム
要 旨  生細胞イメージングやモデリング技術の発展に伴い、生命現象の時空間動態に対する定量データが、画像処理やシミュレーションを介して大量に産出されている。今までに、さまざまな生命現象に対する定量データとそれらに対応するツールが公開されているが、これらのデータとツールは独自のデータ形式を採用しているため互換性がなく、再利用が困難であるという問題があった。そこで我々は、生命現象の時空間動態を統一的に記述するための言語、Biological Dynamics Markup Language(BDML)を開発した(Kyoda et al. Bioinformatics 31, 1044-1052, 2015)。BDMLはXMLを基盤としており、その可読性の高さはデータの共有、各種ツール群の開発を容易にし、また拡張性の高さは将来の新しいタイプのデータへの柔軟な対応を可能にする。BDML ver. 0.2では、分子、細胞から個体レベルの動態に至る多種多様な定量データが記述可能である。現在、大規模データへの高速データアクセスを可能にするために、HDF5バイナリ形式への拡張を行っている。
発表資料  pdf-i    doi:10.18908/togo2016.p028
番 号 29
タイトル SSBD:生命動態情報と細胞・発生画像情報を活用するソフトウェアの開発とその進展
発表者 ○ホー・ケネス、遠里由佳子、京田耕司、大浪修一
所 属 理化学研究所 生命システム研究センター 発生動態研究チーム
要 旨  生命動態システム科学の統合データベースSSBD (Systems Science of Biological Dynamics database; http://ssbd.qbic.riken.jp) では、バイオイメージインフォマティクス技術や計算機シミュレーションにより得られる分子や細胞、個体などの多様な生命現象の時空間動態に関する定量データや画像データを、データベースに格納・共有している(Tohsato et al. Bioinformatics, accepted)。本年度は、それらデータの可視化や解析に利用できるREST APIなどのウェブサービスをはじめ、さまざまなソフトウェアツールやプラットフォームの開発・改善を行い、SSBDで公開した。また、SSBDのオープンソース版の開発も行い、ソースをGitHubで、イメージをDocker Hubで公開した。これらすべてのソフトウェアは、GPLv3で配布されている。本ポスターでは、SSBDで提供しているサービスおよびソフトウェアツール開発の進展を、その活用例を含めて紹介する。
発表資料  pdf-i    doi:10.18908/togo2016.p029
番 号 30
タイトル 人材育成教材ポータルサイトとしての統合TV
発表者 ○小野浩雅、坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  統合TVは、生命科学分野の有用なデータベース(DB)やツールの使い方を動画で紹介するウェブサイトとして、2007年7月から運用しているサービスである。サービス開始以来、現在1100本以上の解説動画を作成・公開している。昨年のウェブサイトリニューアルの際、統合データベース講習会AJACSの資料と講習動画を連携させたことに加え、各コンテンツにDOIを付与するなど、人材育成教材のポータルサイトとして機能しつつある。
 今回、さらなる高機能化を目指し、DBCLS発の日本語Webコンテンツとして好評の「ライフサイエンス新着論文レビュー」の記事との有機的な連携を行った。 また、ライフサイエンス分野の静止画を提供する「生物アイコン」および「TogoPictureGallery」のコンテンツについても統合TVウェブサイトから閲覧可能になった。
 本発表では、統合TVウェブサイトに追加された新機能を紹介するとともに、利用者の観点から改善点や要望などをいただく機会としたい。
発表資料  pdf-i    doi:10.18908/togo2016.p030
番 号 31
タイトル 日本語Webコンテンツ「新着論文レビュー」とほかのコンテンツとの連携
発表者 ○飯田啓介、小野浩雅、山本泰智
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  ライフサイエンス統合データベースセンターは、2010年9月より、日本語Webコンテンツとして「ライフサイエンス 新着論文レビュー」を公開している。これは、トップジャーナルに掲載された日本人を著者とする生命科学分野の論文について、論文の著者自身の執筆による日本語のレビューを、だれでも自由に閲覧・利用できるよう、いち早く公開するもので、すでに1000本近くが公開されている。今回、ほかのコンテンツとの連携として、それぞれのレビューから、実際に活用したデータベースやウェブツールについて、それらの使い方を動画で紹介するウェブサイト「統合TV」の関連するページへのリンクを設けた。また、関連する基礎知識の解説として、生命科学の教科書“A Comprehensive Approach To LIFE SCINECE”(羊土社『理系総合のための生命科学 第2版』英語版)の関連する節へのリンクを設けた。このことにより、読者の利便性が高まるとともに、「新着論文レビュー」が単なる解説記事としてだけでなく、データベースやテキストなどさまざまなコンテンツのプラットホームへと発展する足がかりとなることが期待される。
発表資料  pdf-i    doi:10.18908/togo2016.p031
番 号 32
タイトル GlycoTM - 糖鎖情報マイニングの為の文献アノテーションデータベースの構築
発表者 ○金進東1)、鹿内俊秀2)、奥田修二郎3)、河野信1)、成松久2)
所 属 1) 情報・システム研究機構 ライフサイエンス統合データベースセンター 
2)産業技術総合研究所 糖鎖技術研究グループ 3)新潟大学
要 旨  より良い知識データベースを効率的に構築するためには文献からのマイニング作業が必要である。また、研究現場が求める知識発見のためのマイニングには多様な情報を使って文献をアノテーションする必要がある。しかしながら、これらを実現するためには文献の内容に関する専門的な知識以外にも言語処理のスキルと長い作業時間が要求される作業が必要である。本発表では糖鎖関連データベース構築のために利用している文献アノテーションデータベース、GlycoTMを紹介する。これはGlycobiology誌のアブストラクトに含まれる糖鎖構造名や糖鎖エピトープなどの様々な情報をアノテーションとして付けておき、いつでもアクセスできるように公開されたデータベースである。検索したい単語が出現している文献へ素早くアクセスできるように検索インタフェースを開発した。GlycoTMを使ってデータベースキュレーションに役立つ事例も紹介する。GlycoTMはPubDictionariesとPubAnnotationの二つのウェブサービスを使って開発された。これらは様々な研究領域の辞書データと文献アノテーションデータの開発・管理・活用のために開発されたレポジトリ及びウェブサービスである。本発表ではこの二つのサービスを使って文献アノテーションデータを開発する方法も紹介する。
発表資料  pdf-i    doi:10.18908/togo2016.p032
番 号 33
タイトル 糖鎖関連の遺伝子と遺伝性疾患に関する知識ベースの開発
発表者 ソロビヨワ・イェレナ1)、鈴木芳典1)、○藤田典昭1)、佐藤隆1)、栂谷内晶1)、安形清彦1)、横尾岳彦1)、
久保田智巳2)、野呂絵里花1)、木下聖子1),3)、鹿内俊秀1)、成松久1)
所 属 1)産業技術総合研究所 糖鎖技術研究グループ 2)産業技術総合研究所 構造創薬研究グループ 3)創価大学 理工学部
要 旨  我々は統合化推進プログラムの一環として糖鎖関連データベースの統合を推進している。近年コンピュータが自動処理を行えるデータを付与することで、より高度な情報探索や語彙の共有、情報の集約・連結を実現できるセマンティックWEBが注目されている。我々はデータの流通性・相互運用性をより高めるため、現在公開されている糖鎖に関連したデータベースをセマンティックWEBに対応することにした。従来から我々は、糖鎖遺伝子のデータベースとしてGGDB(GlycoGene Database)を、また糖鎖関連の遺伝性疾患とその原因遺伝子のデータベースとしてGDGDB(Glyco-Disease Genes Database)を構築し公開している。今回、GGDBに格納している糖鎖遺伝子の概要や代表的な反応情報、基質特異性情報のRDF化を行った。またGDGDBでは情報を階層化・分類化し、GGDBや外部の情報リソースと関連付けて、糖鎖関連の遺伝性疾患に関するオントロジー(GGDonto)を構築した。またこれらの情報を検索・表示するユーザーインターフェースの開発にあたっては、WEBページへのHTML埋め込み方式による再利用可能なRDFデータの可視化ツールを開発した。
発表資料  pdf-i    doi:10.18908/togo2016.p033
番 号 34
タイトル GlyTouCan Partner:糖鎖データ連携のためのプログラム
発表者 ○山田一作1)、松原正陽1)、新町大輔2)、青木ポール信行2)、木下聖子2),3)、成松久3)
所 属 1)野口研究所 2)創価大学 理工学部 3)産業技術総合研究所 糖鎖技術研究グループ
要 旨  糖鎖は分岐を含む複雑な化学構造であり、糖鎖研究では単糖の種類や結合位置が不明などの曖昧さを含む構造も利用される。我々は糖鎖構造を明確にするため、新しい糖鎖構造表記法であるWURCS(PMID: 24897372)やGlyTouCan (国際糖鎖構造リポジトリ: https://glytoucan.org PMID: 26476458) を開発してきた。GlyTouCanは糖鎖構造に対してアクセッション番号を付与するとともに、糖鎖構造ハブとして様々なデータベースとの連携を進めている。このようなデータベース連携のためのデータはGlyTouCan Partnerから提供される。GlyTouCan Partnerの一つであるGlycoNAVI (http://glyconavi.org) は、PDB(PMID: 14634627)やPubChem(PMID: 26400175)などの化学構造とGlyTouCanの糖鎖構造を橋渡しするデータをWURCSを利用することで提供している。本発表ではGlyTouCan PartnerによるGlyTouCanの利活用と糖鎖データの統合化について紹介する。
発表資料  pdf-i    doi:10.18908/togo2016.p034
番 号 35
タイトル 35 WURCSFramework ­ Glycoinformatics Library for Glycan Structure Analysis and Representation using WURCS
発表者 ○松原正陽1)、山田一作1)、木下聖子2),3)、青木信行2)、土屋伸一郎2)、成松久3)
所 属 1)野口研究所 2)創価大学 理工学部 3)産業技術総合研究所 糖鎖技術研究グループ
要 旨  炭水化物は構成要素となる単糖への様々な修飾や残基間の枝分かれによって複雑な構造を取る。特に糖鎖は、その生物学的機能、性質、および構造について、糖鎖生物学を含む様々な分野で盛んに研究されており、得られた構造データは各分野の様々なデータベースに登録されている。WURCSは、それらのデータベース上の複雑で多様な炭水化物構造データの一意な区別のために、単糖およびその間の結合に関する原子レベルの情報に基づいて線形文字列化する表記法およびアルゴリズムである。WURCSは糖鎖構造の識別子としてだけでなく、糖鎖構造を解釈する枠組みとしても利用可能である。WURCSFrameworkは、それに基づいて糖鎖構造の表現・解析を行うライブラリである。現在、WURCSFrameworkを使った外部アプリケーションが開発されており、フォーマット変換や可視化、構造検索のためのRDF化等が可能になる。本発表ではWURCSFrameworkの機能、およびWURCSFrameworkを利用したアプリケーションについて紹介する。
発表資料  pdf-i    doi:10.18908/togo2016.p035
番 号 36
タイトル 国際糖鎖構造リポジトリの”Enrichment cycle”
発表者 ○新町大輔1)、木下聖子1),2)、青木ポール信行1)、土屋伸一郎1)、山田一作3)、松原正陽3)、藤田典昭2)、
鈴木芳典2)、ソロビヨワ・イェレナ2)、鹿内俊秀2)、奥田修二郎4)、川嵜敏祐5)、成松久2)
所 属 1)創価大学 2)産業技術総合研究所 3)野口研究所 4)新潟大学 5)立命館大学
要 旨  我々は2014年4月より、国際糖鎖構造リポジトリであるGlyTouCanを開発し、これまで約4万件の糖鎖構造に対して、ユニークなアクセッション番号が割り当てられている。現在、GlyTouCanでは糖鎖構造の登録後、アクセッション番号を割り当てるだけでなく、糖鎖構造情報から次のような情報の生成も行っている:1)糖鎖構造の質量、2)モチーフ構造との関係性、3)トポロジーとの関係性、4)IUPAC, GlycoCT, WURCSといった糖鎖構造表記が生成される。これらの情報をRDFで保持し、1つの糖鎖構造に対するメタ情報をSPARQLで取得し、各糖鎖のエントリーページで表示している。加えて、エントリーページでは糖鎖構造に関連する外部リンクをGlyTouCan Partnerから提供し、外部のデータベースとの連携も行われている。将来的に、エントリーページの糖鎖構造をテンプレートとした新規登録方法も利用可能にすることで、登録 → 情報の充実化 → 可視化 → エントリーページからの編集・登録というサイクルを築く予定である。そうすることでGlyTouCanの充実化を図ることが期待できる。
発表資料  pdf-i    doi:10.18908/togo2016.p036
番 号 37
タイトル 日本糖鎖科学コンソーシアムデータベース (JCGGDB)
発表者 ○ソロビヨワ・イェレナ1)、藤田典昭1)、鹿内俊秀1)、鈴木芳典1)、木下聖子1),2)、成松久1)
所 属 1)産業技術総合研究所 糖鎖技術研究グループ  2)創価大学 理工学部
要 旨  産総研・糖鎖技術研究グループは文部科学省委託研究開発事業やJST/NBDCの「ライフサイエンスデータベース統合化推進プログラム」に参加し、糖鎖関連の多種多様なデータベースを構築し、糖鎖関連データベースの統合化を推進してきた。2010年から公開されている糖鎖科学コンソーシアムのデータベース(JCGGDB; http://jcggdb.jp)を活用している。我々は、糖鎖関連データベースの統合化の活動において、それらのデータベースのコンテンツをRDF化するとともに、オントロジーの開発も行っている。RDF化とオントロジーの開発にあたっては、SKOS、OWL、RDFなどのセマンティックWeb技術を用いることより、関連データベース及びオントロジーとの連結を可能にする。糖鎖関連データベースに蓄積されている情報の理解をより深めるために、データの検索や階層構造の閲覧、詳細表示ができるユーザインタフェースも開発と提供を行っている。現在、RDFの形式で公開されているデータベースはGlycoProtDB (http://acgg.asia/db/gpdb) 、LfDB (http://acgg.asia/db/lfdb) 、GGDB (http://acgg.asia/db/ggdb) 、GDGDB (http://acgg.asia/db/diseases/gdgdb) 、PACDB (http://acgg.asia/db/diseases/pacdb) である。実験で得られた糖鎖修飾位置のグライコフォームの情報も公開した。RDF化された情報は糖鎖関連の分野で研究する研究者の知識の理解と整理を容易いものとし、セマンティックウェブ化した様々なデータと結びつくことで新しい知識発見に役立つと考えられる。このような糖鎖関連データベースの統合化について報告する。
発表資料  pdf-i    doi:10.18908/togo2016.p037
番 号 38
タイトル SEVENS-Pathway: ヒトGPCRのシグナル伝達パスウェイ解析統合環境
発表者 天野えみか、片山友香、丸山幸、池田修己、○諏訪牧子
所 属 青山学院大学 理工学部 化学・生命科学科
要 旨  Gタンパク質共役型受容体(GPCR)は身体のあらゆる組織に存在し、リガンドと結合したシグナルが広範囲なパスウェイを通り細胞の核まで伝達されるが、パスウェイに異常があると様々な重篤な疾患につながる。もしシグナル伝達パスウェイを網羅的に探索できれば、生命現象の本質的理解と制御が可能になり、副作用が少ない薬の設計などの応用へもつながる。
 そこで網羅的GPCR遺伝子DB(SEVENS[1],[2])をベースに、全GPCRのシグナル伝達情報を一元管理し、特定のGPCRとリガンドの組合せから細胞内現象を検索できるDBを目指した。現在314種のヒトGPCRに対して論文からパスウェイ情報(タンパク質間制御関係、経路中での生産物、発現遺伝子など)を抽出し、XML形式化および可視化している。今後、膨大な数の論文からの情報追加に向けテキストマイニングの検討も含め、更新を進める。

[1] Advances in Experimental Med.and Biol. 2014:796, 205-224. Suwa M.
[2] Pharmaceuticals. 2011: 4, 652-664. Suwa M, Sugihara M, Ono Y.
発表資料  pdf-i    doi:10.18908/togo2016.p038
番 号 39
タイトル 蛋白質複合体データベース:OLIGAMI
発表者 ○藤原和夫、池口雅道
所 属 創価大学 理工学部 共生創造理工学科
要 旨  OLIGAMI(OLIGomer Architecture and Molecular Interface)は、ドメインのフォールド分類(SCOPe)と複合体情報の2軸を持ち、注目している蛋白質の複合体構造を素早く探し、視覚化することができるデータベースとして公開してきた。OLIGAMIでは複合体情報として、生物学的複合体の座標データ(Biological assembly)に含まれる分子鎖の種類がポリペプチド鎖か核酸鎖か、アミノ酸配列が同じか異なっているかといった情報をアルファベットで表したChain Formulaを提供している。今回の発表では、以下に示す6つのポイントについて行った改良点について紹介する。1)複合体インターフェースの二次構造分析、2)分子間βシート、分子間SS結合情報の追加、3)立体構造ベースでのChain Formulaの提供、4)詳細検索機能、5)フォールド分類へのCATH分類の追加、6)膜蛋白質データベースOPM情報の追加による水溶性蛋白質、膜蛋白質の選択機能。

URL http://protein.t.soka.ac.jp/oligami/
番 号 40
タイトル 蛋白質構造データバンク(PDBj)の高度化と統合的運用
発表者 ○金城玲1)、中川敦史1)、猿渡茂2)、鈴木博文1)、中村春木1)
所 属 1)大阪大学 蛋白質研究所 2)北里大学 理学部
要 旨  タンパク質、核酸、糖鎖などの生体高分子の立体構造情報はProtein Data Bank (PDB)として集積され、2016年6月には12万件を超える構造データを公開している。PDBjは、国際的組織であるwwPDBの一員として、共通した品質管理によるデータ登録作業とダウンロード・サイトの運営および独自のサービス・ツールや二次DBの提供、セマンティック化を実施している。
 これまで、地域による登録サイトの自動振り分け機能等データ登録の高度化と配布を継続的に実施してきた。特にDBの統合的運用を図るため、wwPDB/RDFデータをNBDCのRDFポータルに統合し、特にEBIのPDBeおよびUniProtグループと協力してSIFTSデータのRDF化を実施した。
 また、クライオ電子顕微鏡の進展に対応するため、巨大構造も高速に表示できるmolmilビューアや、PDB、EMDB、SASBDBの3つのDBに対して横断的に構造形状の同時比較・検索ができるOmokage検索[1]の開発・公開を行った。

[1] Suzuki et al, Bioinformatics 32, 619-620, 2016.
発表資料  pdf-i    doi:10.18908/togo2016.p040
番 号 41
タイトル 高度化された生体高分子NMRデータベース(PDBj-BMRB)による統合的利用
発表者 ○小林直宏1)、横地政史1)、岩田武史1)、児嶋長次郎2)、藤原敏道1)
所 属 1)大阪大学 蛋白質研究所 2)横浜国立大学 理工学部
要 旨  NMR研究法はリガンド相互作用や蛋白質の動的性質の解析などに威力を発揮する。PDBj-BMRBグループは米Wisconsin大学との国際的協力により生体高分子のNMR実験データについて、1万件を超えるデータの登録とBioResMagBank(BMRB)からの公開を行っている。これまでに我々は全データをオントロジーに基づいてXML/RDF化し、RDF検索のためのSPARQLエンドポイントを公開することで他の生命科学系データベースとの統合的検索を可能にした[1]。最近我々はBMRB-RDFを利用することで、SAHG、PDB、UniProt、IntAct,、OMIMと統合した2次データベース検索サービス(Multiple Protein Model Search)を開発公開した。またNMRの解析ツールであるMagROにもSPARKL検索機能を搭載し公開した。更にポータルサイトにPDB, BMRB, UniProt, IntAct, EMDBなどの複合的なデータベースを一括検索する機能を搭載した。

[1] Yokochi, M., et al., J. Biomed. Semantics 7:16, 2016
発表資料  pdf-i    doi:10.18908/togo2016.p041
番 号 42
タイトル 疾患特異的タンパク質の統計学的探索方法
発表者 〇津留美智代
所 属 久留米大学学長直属 疾患プロテオミクス 先端癌治療研究センター
要 旨  ヒトの血清中には、約10,000種類のタンパク質が存在し、その中には、国民の健康維持に有用な情報が存在している。我々は、患者血清と健常者の血清を比較し、疾患特異的タンパク質を探索し、HPLCにて精製後、アミノ酸配列を決定し、疾患との検証研究後、アミノ酸3D構造解析、ドラッグデザインの作製を行い、橋渡し研究を遂行している。
 既に、我が国の難病疾患、がん転移の特異的なタンパク質を発見し、その立証研究から医薬品開発を行っている。これらの研究課程において、プロテオミクス、ゲノミクスの研究技術から展開されるデータベースの活用が必須である。
 LC-MS-MSからのアミノ酸配列決定、ゲノムアレイ、プロトアレイからのパスウエイ解析、動物実験、sh or si RNAによる立証研究、疾患特異的タンパク質の3D構造解析、ドラッグデザインの構築は、発症予防、早期診断、治療製剤が可能となる。
 我が国の科学研究が、多くの疾病克服に繋がり、国民に安心安全な医療を提供できる基盤は、生命科学のデータの統合が重要であることを経験した。
発表資料  pdf-i    doi:10.18908/togo2016.p042
番 号 43
タイトル jPOST: 今こんな感じです
発表者 ○守屋勇樹1)、河野信1)、奥田修二郎2)、山本格3)、松本雅記4)、小林大樹5)、荒木令江5)、吉沢明康6)、五斗進6)、
田畑剛7)、杉山直幸7)、石濱泰7)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター 2)新潟大学大学院 医歯学総合研究科 
3)新潟大学 産学地域連携推進機構 4)九州大学 生体防御医学研究所 5)熊本大学大学院 生命科学研究部 
6)京都大学 化学研究所 バイオインフォマティクスセンター 7)京都大学大学院 薬学研究科
要 旨  異なる実験由来のプロテオームデータを統合し、統一された信頼基準で結果を解釈するために、jPOST(Japan ProteOme STandard Repository/Database, http://jpost.org/)では、質量分析装置から出力される生データを含む、プロテオームデータを投稿・蓄積するためのリポジトリ、生データを再解析するための標準化されたワークフロー、再解析後の高品質なプロテオームデータを蓄積・可視化するデータベースの3つを開発している。リポジトリは今年5月に一般公開され、現在プロテオームデータが蓄積されつつある。再解析ワークフローにおいては、複数のピーク検出ソフトとサーチエンジンを組み合わせることで、生データから高精度かつより多くのペプチドやタンパク質を検出する手法を開発している。またデータベースは、すでにRDF化が進んでいる他の生命科学データベースとの相互利用を考慮し、RDF技術を基に開発を進めており、ProteomeCentralと共通のメタデータを表現するためのRDFスキーマ及び、ペプチドやタンパク質の同定結果を記述するためのRDFスキーマのデザインが進んでいる。
発表資料  pdf-i    doi:10.18908/togo2016.p043
番 号 44
タイトル jPOST: リポジトリ始めました
発表者 ○奥田修二郎1)、守屋勇樹2)、河野信2)、山本格3)、松本雅記4)、小林大樹5)、荒木令江5)、吉沢明康6)、五斗進6)、
田畑剛7)、杉山直幸7)、石濱泰7)
所 属 1)新潟大学大学院 医歯学総合研究科 2)情報・システム研究機構 ライフサイエンス統合データベースセンター 
3)新潟大学 産学地域連携推進機構 4)九州大学 生体防御医学研究所 5)熊本大学大学院 生命科学研究部 
6)京都大学 化学研究所 バイオインフォマティクスセンター 7)京都大学大学院 薬学研究科
要 旨  jPOSTでは、今回、データリポジトリシステムを新たに開発し、全世界に向けて公開した。本システムは、アジア・オセアニア地域における初めての国際標準プロテオームデータリポジトリであり、国際標準のデータリポジトリシステムを提供するProteomeXchange(PX)コンソーシアムの正式メンバーとして承認された。今回運用を開始し、全世界に向けて公開したリポジトリには、以下に示すような特徴がある。①データの属性情報について、実際の実験プロトコルに即した新規の入力インターフェースが実装されているため、既存のリポジトリと比べ、より多くの情報をより少ない手間で入力可能である。②jPOSTのPXへの加入が承認されたため、データアップロード時にjPOSTリポジトリのIDに加え、PXが発行するID(PX ID)も自動で取得できる。③データアップロードを短時間で完了することが出来るような新規高速ファイルアップロードシステムを実現した。今後、アジアを中心に世界中のプロテオームデータをjPOSTレポジトリに収集することが可能となる。
発表資料  pdf-i    doi:10.18908/togo2016.p044
番 号 45
タイトル jPOST: 再解析考え中です
発表者 ○吉沢明康1)、田畑剛2)、守屋勇樹3)、河野信3)、奥田修二郎4)、渡辺由4)、山本格5)、松本雅記6)、高見知代6)、
小林大樹7)、荒木令江7)、杉山直幸2)、五斗進1)、石濱泰2)
所 属 1)京都大学 化学研究所 バイオインフォマティクスセンター 2)京都大学大学院 薬学研究科 
3)情報・システム研究機構 ライフサイエンス統合データベースセンター 4)新潟大学大学院 医歯学総合研究科 
5)新潟大学 生体液バイオマーカーセンター 6)九州大学 生体防御医学研究所 7)熊本大学大学院 生命科学研究部
要 旨  2015年から統合化推進プログラムのもとで構築が開始されたプロテオーム統合データベース『jPOST』 (http://jpost.org/) は、実験で得られた質量スペクトルの生データを公開するためのリポジトリと、そのデータを独自に解析(再解析)した結果を収録するデータベースから構成される。この「再解析」のために、「曖昧なデータ、“グレー”なデータをデータベース検索の結果から極力取り除く」方法論を、現在構築中である。この過程で、「b-ion系列・y-ion系列のイオンが、連続したアミノ酸残基にアサインされているか」など、人手による質量ピークとアミノ酸配列の比較と等価の作業によって同定結果を検証したところ、ピーク探知やデータベース検索に用いるソフトウェアによって、探知し易いイオンやアミノ酸配列に相違があることが判明した。これは実装されているアルゴリズムの差異に起因すると考えられ、この特徴を利用することで、同定過程に於ける“取りこぼし”を減少させることが可能であると考えられる。
発表資料  pdf-i    doi:10.18908/togo2016.p045
番 号 46
タイトル プロテオームメタデータのRDF化
発表者 ○河野信1)、守屋勇樹1)、Tobias Ternent2) 、Juan Antonio Vizcaino2)、Eric Deutsch3)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター 2)European Molecular Biology Laboratory, European Bioinformatics Institute (EMBL-EBI) 3)Institute for Systems Biology
要 旨  オープンデータの流れの中で、研究結果の根拠となったデータをメタデータとともにリポジトリに登録することが求められている。主に質量分析装置を使って解析がなされるプロテオームのデータはProteomeXchange Consortium(PXC)加盟リポジトリにデポジットされ、そのメタデータはPXCが提供するProteome Centralデータベースから提供されている[1]が、必要なデータにたどり着くためにはこれまでメタデータのブラウジングもしくは簡単なキーワード検索しか手段がなかった。そこで、今回BioHackathon2016において、XMLで提供されているPXC形式メタデータをRDF化し、SPARQLエンドポイントを実装することで、SPARQL検索式を使ったより柔軟な検索が可能となったので報告する。

[1] Vizcaino JA et al., Nature Biotech.
発表資料  pdf-i    doi:10.18908/togo2016.p046
番 号 47
タイトル 日本でのBeaconサービスの提供
発表者 ○河野信1),2)、三橋信孝2)、宮崎和典2)、川嶋実苗2)、箕輪真理1),2)、若栗浩幸3)、鈴木穣4)、菅野純夫4)、
高木利久2)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター 
2)科学技術振興機構 バイオサイエンスデータベースセンター 3)株式会社ダイナコム 
4)東京大学大学院 新領域創成科学研究科
要 旨  近年ゲノム解析のコストが減少したため、個人や細胞株を対象としたゲノムシーケンスが盛んに行われるようになった。このようなデータを幅広く応用するためには、特定の変異を持ったゲノムデータがどこにあるのか、を安全に共有する仕組みが必要となる。国際的に臨床情報やゲノムデータを共有することを目的としてGlobal Alliance for Genomics and Health(GA4GH)が組織され、その中のひとつの取り組みとしてBeaconプロジェクトが進められている。これは、特定のゲノム位置に特定の塩基を持つデータが存在するかをヒトゲノムデータを有するデータベースに対して問い合わせ、その結果をYesもしくはNoで返すというものである。GA4GHではBeaconで交換するデータの標準化を行い、世界中に分散しているヒトゲノムデータベースを横断的に検索可能とするBeacon Networkを構築している。今回、26種類の肺腺がん細胞株の変異データならびにNBDCヒトデータベースの非制限公開データを対象としてBeaconサーバーを実装し、横断検索を可能にしたので報告する。
発表資料  pdf-i    doi:10.18908/togo2016.p047
番 号 48
タイトル ヒトマルチオミクスデータのRDF化と横断検索
発表者 ○河野信1)、若栗浩幸2)、田中聡3)、鈴木穣4)、菅野純夫4)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター 2)株式会社ダイナコム 3)Trans-IT 
4)東京大学大学院 新領域創成科学研究科
要 旨  シーケンス技術の発展にともなって、ゲノム配列だけでなく遺伝子発現やDNAメチル化、転写開始点など、同一のサンプルからさまざまな種類のオミクスデータが測定可能になった。これまでこれらのデータを扱う際は、オミクスデータごとに個別に解析されるか興味の対象となっている特定の部位を横断的にゲノムブラウザで表示するなどに限られ、種類の異なるオミクスデータを網羅的に取り扱うことは難しかった。今回、これらのデータを統一的に表現するためにKERO(Kashiwa Encyclopedia of Regulatory Omics)データベース[1]に収録されているChIP-seq・BS-seq・TSS-seq・RNA-seqのデータをRDF化した。すでにRDF化されているEnsemblのゲノムアノテーションと組み合わせ、FALDO[2]で表現されたゲノム座標を軸として種類の異なるオミクスデータを横断的かつ網羅的に検索する仕組みを構築したので報告する。

[1] http://kero.hgc.jp/
[2] Bolleman et al., J Biomed Semantics, 7:39 (2016)
発表資料  pdf-i    doi:10.18908/togo2016.p048
番 号 49
タイトル 疾患ヒトゲノム変異の生物学的機能注釈を目指した多階層オミクスデータの統合
Regulatory Omics Database for Analyzing Transcriptional Consequences of Human SNVs
発表者 入江拓磨1)、○鈴木穣1)、河野信3)、土原一哉2)、菅野純夫1)
所 属 1)東京大学大学院 新領域創成科学研究科 メディカル情報生命 2)国立がん研究センター 先端医療開発センター 
3)情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  演者らはヒトゲノム多型・変異に生物学的機能注釈を与えるべく、ゲノム変異位置、近傍のエピゲノム(ヒストン修飾、DNAメチル化パターン)、トランスクリプトーム情報(発現量、スプライスパターン)をヒトゲノム情報に統合したデータベースの構築を行っている。現在、データの統合はがんゲノム解析を志向したものを中心に行っているが、最終的には疾患の別を超えたデータの統合を目指す。特に本データベースでは、培養細胞系あるいは生物種を超えてマウスをはじめとする動物モデル系から得られたオミクスデータに焦点を当てている。これにより臨床検体で集積が乏しいエピゲノム情報を充実させ、同時に生物学的機能解析の実践の場としてのモデル系におけるオミクス情報を整備する。我々はこれまでに、がん細胞培養細胞株をモデル系にしたデータベースの構築と公開を行っている。26種類の細胞株について、それぞれ全ゲノムシークエンス、遺伝子発現情報、エピゲノム情報(8種類のヒストン修飾とDNAメチル化情報)を統合したものである。また、本データベースでは外部参照データとして、国内外の日本人ゲノム解析プロジェクトにより産出された日本人多型データ約5000人分が無償、自由に閲覧可能となっている (http://kero.hgc.jp/) 。
発表資料  pdf-i    doi:10.18908/togo2016.p049
番 号 50
タイトル 国際的ゲノミクスデータ統合のアジア拠点: The Asian Mirror of the UCSC Genome Browser Database
発表者 ○川路英哉 1),2)
所 属 1)理化学研究所 情報基盤センター 2)理化学研究所 予防医療・診断技術開発プログラム
要 旨  次世代シーケンサーより産出された生データは国際レポジトリ(SRA, ERA, DRA)に登録されているが、これを効果的に利用する為にはゲノム軸上の情報(変異情報やシグナル強度)への変換が必要である。主要な国際的大規模プロジェクト(1000人ゲノムプロジェクト、ENCODEプロジェクト、国際エピゲノムコンソーシアム(IHEC)、FANTOM5プロジェクト、等)はいずれも、変換処理済データをすぐさま利用できるよう、カリフォルニア大学サンタクルス校の開発するThe UCSC Genome Browser Database が提案するTrack Data Hub方式を用いたデータ共有を進めており、本方式での共有は実際上、ゲノミクスデータを常に扱う研究者にとってデータ流通のデファクトスタンダードである。そこで米国で運営されているThe UCSC Genome Browser Database開発チームと共同し、これのアジアミラーを日本に立ち上げた。本ゲノミクス情報流通基盤の構築によって、アジアの研究者、特に日本の研究者によるゲノミクス情報の発信・利用の促進が期待される。
発表資料  pdf-i    doi:10.18908/togo2016.p050
番 号 51
タイトル 統合化推進プログラムにおけるヒトゲノムバリエーションデータベース
発表者 ○澤井裕美1)、小池麻子2)、豊田裕美1)、山崎茉莉亜1)、井ノ上逸朗3)、辻省次4)、徳永勝士1)
所 属 1)東京大学大学院 医学系研究科 2)日立製作所 研究開発グループ 3)情報・システム研究機構 国立遺伝学研究所 
4)東京大学 医学部附属病院
要 旨  SNPタイピング技術と次世代シーケンサ技術の技術革新により、ゲノムワイドな疾患関連多型・変異探索が可能となり、多くの疾患関連多型・変異が発見されつつある。我々のグループでは国内/アジアにおけるこれらのデータの散逸を防ぎ研究者間でデータ共有化するために、2007年よりGWAS-DB, CNV-DBを、2011年度よりHuman variation DB, HLA-DBを構築し (https://gwas.biosciencedbc.jp/) 、GWASデータ、NGS変異データの提供を広く呼びかけると共にデータの預入れと再配布の運用を行ってきた。2014年度からはNBDCがデータの預入れと再配布を実施し、その計算結果の可視化、及び、主要なDBの癌体細胞変異のドライバー変異やシグナルパスウェイとの関係性の可視化を本DBで引続き実施している。これらのDBにおいてはGWASのデータとともに、健常者や患者の多様な生殖細胞変異(SNV、長配列の挿入/欠失、構造多型)を収集対象とし、文献から抽出した疾患関連変異・臨床情報30,000以上のエントリーも登録しており、日本人/アジア人の変異と表現型(疾患、薬剤応答、ウィルス耐性)との関係の体系化を目指している。
発表資料  pdf-i    doi:10.18908/togo2016.p051
番 号 52
タイトル ヒト内在性レトロウイルス由来転写調節エレメントデータベースの構築
発表者 伊東潤平1),2)、杉本竜太1)、○早野崇英1)、中岡博史1)、井ノ上逸朗1)
所 属 1)情報・システム研究機構 国立遺伝学研究所 2)総合研究大学院大学
要 旨  ヒト内在性レトロウイルス(HERV)は、古代のレトロウイルスがヒトに感染した痕跡と考えられ、ヒトゲノムには500種類(72万断片)のHERVが存在する。HERVは独自の転写調節エレメント(HERVE)を持っている。HERVEがヒトの転写調節に関与するかは不明である。我々はENCODEおよびRoadmap Epigenomicsプロジェクトの100種類のヒト転写調節因子のChIP-seqデータを用いて、ヒト転写調節因子結合部位(TFBS)とHERVとのオーバーラップ(HERV-TFBS)を調べることで、HERVEを網羅的に同定した。このHERVEを、HERVおよびヒト転写調節因子の種類、細胞特異性、HERVがヒトゲノムに挿入された年代、およびHERV挿入部位近傍の遺伝子等で分類し、データベースを構築した。HERVEの中には、サイトカイン応答シグナル経路に関わる遺伝子群の周辺に有意に多く存在しているものがあり、ヒトの転写調節に関与していることが示唆された。このデータベースを公開することで、HERVEのヒトの転写調節への関与を解明するための研究基盤情報を提供したい。
発表資料  pdf-i    doi:10.18908/togo2016.p052
番 号 53
タイトル ヒト疾患に関与するウイルスゲノムのデータベース
発表者 ○金昭、金久實
所 属 京都大学 化学研究所
要 旨  KEGG GENESデータベースには、現在約30万件のウイルス遺伝子データが登録されている。これらはNCBI RefSeqのViralセクションでGeneIDがつけられたものをすべて取り込んだものである。この中でヒト疾患に関与するウイルスに限定し、より正確にはKEGG DISEASE疾患データベースのPATHOGENフィールドにあるウイルスについて、そのゲノム情報をKEGG GENOMEデータベースにも登録した。各エントリはT4で始まるアクセッション番号で識別され、NCBI taxonomy IDに対応したウイルスのパンゲノムに簡単なアノテーションを付与している。疾患については疾患名とともに、ホスト情報を疾患を起こす生物種(現状ではヒトに限定)、レゼルボア、ベクターの3種類に分けて登録している。今後は疾患に関与する遺伝子・タンパク質や抗ウイルス薬のターゲットとなるタンパク質に関するアノテーション情報(KEGGの他データベースへのリンク情報も含む)を付与していく予定である。
発表資料  pdf-i    doi:10.18908/togo2016.p053
番 号 54
タイトル 抗微生物薬と抗悪性腫瘍薬に対する薬剤耐性メカニズムの比較解析
発表者 ○田辺麻央、金久實
所 属 京都大学 化学研究所
要 旨  抗微生物薬(Antimicrobials)や抗悪性腫瘍薬(Antineoplastics)に対する薬剤耐性は、病原体あるいはがん細胞がもつ生物固有の適応能力を反映したものである。我々はこれまで抗微生物薬について、標的分子の変化、酵素等による不活性化、細胞内取り込みの抑制、細胞外排出の促進といたメカニズムをKEGGパスウェイマップで表現し、これらを特徴づける遺伝子セットをシグネチャーモジュールとして、遺伝子変異パターンをシグネチャーKOとして蓄積してきた。がんの化学療法とくにその個別化において、分子標的薬の重要性はますます高まっているが、ここでも薬剤耐性が問題になりつつある。抗悪性腫瘍薬に対する薬剤耐性のメカニズムとしては、抗微生物薬と共通のものがある一方、代替パスウェイの活性化やDNA修復機構の活性化、アポトーシスの抑制といったがん特有のメカニズムも知られており、これらは現在のところ3枚のKEGGパスウェイマップで表現されている。ここでは抗微生物薬と抗悪性腫瘍薬の薬剤耐性を比較し、それぞれについて耐性に対応した医薬品開発の例を紹介する。
発表資料  pdf-i    doi:10.18908/togo2016.p054
番 号 55
タイトル Lung cancer panelを用いたマルチプレックス遺伝子変異解析と肺癌データベース
発表者 ○冨田秀太1),2)、諏澤憲3)、松原岳大2)、森田瑞樹1),2)、宗淳一2),3)、豊岡伸一2),3),4)
所 属 1)岡山大学大学院 医歯薬学総合研究科 2)岡山大学病院 バイオバンク 3)岡山大学病院 呼吸器外科 
4)岡山大学大学院 医歯薬学総合研究科 臨床遺伝子医療学
要 旨  今日、特定の分子の機能や結合を特異的に阻害する「分子標的薬」と呼ばれるタイプの抗がん剤が開発され、「化学療法」と呼ばれる従来の抗がん剤と比較して、著しい奏効率を示しており、がん薬物療法に革命をもたらしている。特に肺腺癌の領域では、2004年に上皮成長因子受容体(EGFR)の変異とEGFR阻害薬の感受性との関連が明らかになるや、その薬剤耐性獲得メカニズムの解明や新規標的遺伝子変異の探索的研究が飛躍的に進んでいる。
我々は岡山大学病院呼吸器外科において根治的外科的切除を受けた肺腺癌160症例を対象に、EGFRを含む20遺伝子の高頻度変異領域(ホットスポット)の遺伝子変異解析が可能なQIAGEN Lung Cancer Panelを用いた解析を行った。その結果、55症例(34%)においてEGFRの遺伝子変異が確認されており、本邦の肺腺癌コホートに関する我々の報告(120症例中38症例(32%)がEGFR遺伝子変異陽性)(Tokumo e t al., Clin Cancer Res. 2005 11(3):1167-73.)と概ね一致する結果を得ることが出来た。また、11症例(6.9%)においてKRASの遺伝子変異が確認されている。我々はこの遺伝子変異データベースを元に、臨床情報との解析、術後の転帰、分子標的薬の感受性との関連性を解析することで、特定の遺伝子変異を有する症例に最適化されたPrecision Medicineを実施しうるknowledge databaseの構築を進めている。
発表資料  pdf-i    doi:10.18908/togo2016.p055
番 号 56
タイトル 希少・未診断疾患の遺伝学的検査におけるヴァリアント意義付けとデータベース
発表者 ○川本祥子1),2)、松田圭子3)、川戸和美3)、山本悠斗3)、三島祐子3)、植田紀美子3)、岡本伸彦2),3)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター 
2)大阪府立母子保健総合医療センター研究所 代謝部門 3)大阪府立母子保健総合医療センター 遺伝診療科
要 旨  次世代シーケンサ(NGS)を活用した希少・未診断疾患の遺伝子検査が世界的に広がりを見せている。日本でも2015年よりIRUD(未診断疾患イニシアチブ)がスタートし、NGSによる原因遺伝子の同定だけでなく、細胞株や iPS 細胞を用いた病態解析の他、フェノタイプ情報のDB化により、症例のマッチングや新規疾患概念の確立を目指している。大阪府立母子保健総合医療センター遺伝診療科は、充実した遺伝カウンセリング体制のもと、小児の先天疾患・遺伝性疾患に対し年間500例以上の遺伝学的検査を実施している。また、IRUD-P(小児希少未診断疾患イニシアチブ)の拠点病院の一つとして、新規疾患の同定にも貢献している。疾患エキソーム解析では、複数の候補遺伝子から、疾患に関連するヴァリアントを絞りこみ、病的意義を判断するために、複数のデータベースと予測プログラムを駆使しなければならない。また、過去から最新にわたる文献や症例報告を調査し、分子と病態の関連知識を抽出するなど、複雑なアノテーション・キュレーション作業が要求される。母子センターでの経験から、ヒト疾患解析に利用されるデータベースと統合化の現状について報告する。
発表資料  pdf-i    doi:10.18908/togo2016.p056
番 号 57
タイトル 文献データに基づく症例検索システムの開発
発表者 ○藤原豊史1),2)、山本泰智3)、金進東3)、高木利久2)
所 属 1)株式会社インテック 2)東京大学大学院 新領域創成科学研究科 
3)情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  新生児の約4%は何らかの希少疾患に罹患していると推定され、その症状からは病名を判断できず,診断不明とされる患者(未診断患者)が数多く存在する。未診断患者の診断にはエクソーム解析が有効であるが、患者が罹患している疾患の原因遺伝子が同定されてない場合には適用できない。現在、疾患原因遺伝子を同定する研究が盛んに行われているが、症状や遺伝情報が共通する複数の症例を効率良く集める仕組みづくりが課題となっている。そのため、症例シェアシステムがいくつか開発・運用されているが、医者や研究者が手動で症例を登録するため、スケーラビリティの問題に直面している。そこで我々は、MEDLINEに登録されている約180万件の症例報告を対象に類似症例を検索できる「文献データに基づく症例検索システム」を提案する。複数のオントロジーを用いて表現型の異常や疾患名などの症例情報を自動抽出することで、症例を大規模に集めることができる。また、類似症例を検索する場合に、単語の表記が異なる場合においても意味的な距離を考慮して類似度を計算できる。本発表では現状と今後の展望について報告する。
発表資料  pdf-i    doi:10.18908/togo2016.p057
番 号 58
タイトル メタボロミクスを基盤としたエコロジーとヘルスケア・インフォマティクス
発表者 櫻井望1)、有田正規2),3)、○金谷重彦4)
所 属 1)かずさDNA研究所 2)理化学研究所 環境資源科学研究センター 3)情報・システム研究機構 国立遺伝学研究所 
4)奈良先端科学技術大学院大学
要 旨  質量分析装置による測定技術の進展に伴い、ppmの精度で代謝物の精密分子量を測定することが可能になった。そこで、精密分子量をもとに分子式さらには代謝物の候補を列挙することができれば、細胞・組織におけるメタボロームを悉皆的に把握することができる。生物種と代謝物の関係を文献情報から網羅したデータベースがあれば、生物サンプルにおける質量分析をもとに精密分子量から分子式を推定し、生体内の二次代謝物の候補を列挙することが達成される。生物種数と地球上の顕花植物数の割合から、地球上に存在する代謝物種の数は106万と推定できる。地球上の顕花植物が生合成できる代謝物の約1割が構造決定されており、KNApSAcK Core DB にはその半数が登録された。本データベースは,新規バイオデータベースの開発ならびにバイオインフォマティクス研究、ファンクショナルゲノミクス、生物学相互作用の理解のためのメタボロミクスなどの多岐にわたる分野で活用されている。本発表では,エコロジーならびにヘルスケアに焦点をあてた代謝物と生物活性の関係に関するデータベースについて紹介する。
発表資料  pdf-i    doi:10.18908/togo2016.p058
番 号 59
タイトル 省みられない希少難病情報の国内での活用に向けて
発表者 ○大倉政宏、高橋和之
所 属 希少疾患難病連絡会
要 旨  希少難病は日本において対象患者が5万人以下の稀な疾患であるが、希少疾患自体は疾患数が7000程度存在するとされており、個々の疾患としては希少であるものの、希少難病全体では17名に1人の割合で存在する「まれ」ではない疾患である。
 希少疾患の中には、自覚症状が無いなどQOLに影響の無い疾患も存在するが、3分の1は知能や運動障害を示すなど重篤な疾患であり生後1年以内に命を落とすことも多い医療ニーズの極めて高い疾患である。
 最近までは、このような希少難病は製薬産業が手がけられない経済的に事業化が困難な領域と考えられて来たが、癌などの領域で患者層のセグメント化が進むに従い、癌以外の分野でも事業として成功させ急成長するバイオベンチャー(BV)も出現してきた。しかし、日本においてはそのような希少難病BVは残念ながら大きくは成功していない。
 命に関わる医療ニーズの高い疾患であり、世界的には事業化の可能性が高まっているにも係わらず、国内での研究開発が進まない要因の一つに、研究機関や製薬企業に必要な情報が伝達されていない事が考えられる。その為、希少難病の情報に関し、現在入手可能な情報の統合化や情報提供について初期的な検討を行った。薬価も含めた事業性の観点から製薬企業が必要な情報についても考察したい。
発表資料  pdf-i    doi:10.18908/togo2016.p059
番 号 60
タイトル 創薬・疾患研究のための情報体系構築 ~ 基礎研究から臨床試験まで ~
発表者 ○坂手龍一1)、深川明子1)、鈴木雅2)、松山晃文1)
所 属 1)医薬基盤・健康・栄養研究所 2)日本製薬工業協会 医薬産業政策研究所
要 旨  創薬・疾患研究の推進には、基礎から応用への研究の流れを俯瞰する情報体系が重要である。大学研究者が創薬開発情報を、また、製薬会社研究者が基礎研究情報を容易に取得できれば、適切なターゲット探索などの研究効率が向上すると考えられる。このような情報体系の構築を目指し、我々は①医薬基盤・健康・栄養研究所のデータベース統合検索[1]と、②実験動物・疫学研究・バイオバンクの所在情報データベース[2]の構築を行ってきた。さらに、現在、創薬・疾患研究の対象として注目されている難治性疾患(希少疾患を含む)について、③厚生労働省指定難病306疾病の臨床試験情報の調査[3]を実施しデータベースを構築した。疾患と薬物の情報を横断的に取得可能とすることで、発症機序解明やドラッグリポジショニング標的探索の促進を図る。これらにより、創薬・疾患研究の新規知識発見のためのポータルサイト構築を目指している。

[1] 創薬支援データベース統合検索  https://alldbs.nibiohn.go.jp
[2] メディカル・バイオリソース・データベース  https://mbrdb.nibiohn.go.jp
[3] 「指定難病に対する臨床試験実施状況」 政策研ニュースNo.48 (H28.7)
発表資料  pdf-i    doi:10.18908/togo2016.p060
番 号 61
タイトル がん個別化医療における診療支援のための情報共有に向けた提案
発表者 ○森田瑞樹1),2)、五十嵐芳暢2)、河野信3)、長尾知生子2)、水口賢司2)
所 属 1)岡山大学 2)医薬基盤・健康・栄養研究所 3)情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  がんの治療では、治療の前にがん関連遺伝子を網羅的に解析し、検出された遺伝子変異に応じて最適な治療を選択することが可能になってきた。しかし、検出される遺伝子変異は疾患に与える影響や治療への反応が未解明であることが多く、得られた変異情報が必ずしも実際の診療に活かせていない。そこで本研究では、この課題の1つの解決策として、同じ遺伝子変異が検出された症例での治療の情報を共有することを目指し、標準データ項目および蓄積されたデータに対する検索アルゴリズムの提案を行う。
 これまでに、共有および検索のための標準データ項目をMatchMaker Exchange API [1]の拡張として作成し、文献に公開されている遺伝子変異情報および公共データベースにあるがん細胞株の変異情報をこの形式でデータ化し、このデータに対して検索ができることを確認した。今後、実際の症例を登録し、現場の診療への適用に取り組む。

[1] Buske OJ et al., The Matchmaker Exchange API: Automating Patient Matching Through the Exchange of Structured Phenotypic and Genotypic Profiles. Human Mutation, 36, 922–927 (2015)
発表資料  pdf-i    doi:10.18908/togo2016.p061
番 号 62
タイトル 統合データウェアハウスTargetMineの高度化とデータ解析ツール
発表者 ○陳怡安、ロケシュ・テリパチ、川島和、水口賢司
所 属 医薬基盤・健康・栄養研究所 バイオインフォマティクスプロジェクト
要 旨  私たちは国際的に広く使用されている30以上の公共のデータソースを統合し、創薬の初期研究における支援を目的とした統合データウェアハウスTargetMine (http://targetmine.mizuguchilab.org) を開発、公開している。創薬標的の探索のために、TargetMineはデータモデルを常に改良し、新規のデータを追加してきている。最近では、特に医薬品に関する情報に力を入れており、本発表では、薬剤の代謝酵素、別名、解剖治療化学分類(ATC分類)、日本標準商品分類(JSC)などの情報とそれらの統合解析機能を紹介する。さらに、定型的な解析だけでなく、多面的な意思決定を対話的に支援する補助解析ツール(ワークフロー機能)を開発した[1]。これにより、創薬標的の探索のみならず、一般的な創薬支援のデータ解析プラットフォームを提供可能になった。

[1] Chen et al., An integrative data analysis platform for gene set analysis and knowledge discovery in a data warehouse framework. Database, 2016: baw009.
発表資料  pdf-i    doi:10.18908/togo2016.p062
番 号 63
タイトル 創薬・疾患研究のためのデータベース検索システム Sagace
発表者 長尾知生子1)、○五十嵐芳暢2)、森田瑞樹1),3)、陳怡安1)、深川明子4)、坂手龍一5)、水口賢司1)
所 属 1)医薬基盤・健康・栄養研究所 バイオインフォマティクスプロジェクト 
2)同 トキシコゲノミクス・インフォマティクスプロジェクト 
3)岡山大学大学院 医歯薬学総合研究科 クリニカルバイオバンクネットワーキング事業化研究講座 
4)医薬基盤・健康・栄養研究所 政策・倫理研究室 5)同 難病資源研究室
要 旨  医薬基盤・健康・栄養研究所では、JSTバイオサイエンスデータベースセンターと連携し、データベース横断検索システムSagace (http://sagace.nibiohn.go.jp) を開発・公開している。
 Sagaceは、創薬・疾患に特化した約180のデータベースを選定・分類して検索対象とし、ファセット(データベースの分類)による検索結果の効率的な絞り込みと、メタデータ(データに関する事項を記述したデータ)を反映した効果的な検索結果の表示を実装した検索システムで、一般的な横断検索システムよりも創薬・疾患研究に関する情報を効率的に発見できる。
 今年度は、検索対象として追加した治験に関するデータベースに新規メタデータを付与することにより、臨床研究情報に関連する検索を強化した。また、検索エンジンの入れ替えにより、検索結果表示速度が飛躍的に向上した。
 Sagaceではこれらの取り組みを通じ、より効率的に創薬・疾患研究を支援する検索システムの構築を目指している。
発表資料  pdf-i    doi:10.18908/togo2016.p063