ポスター発表日程

ポスター発表は以下の日程で行います。

【10月4日(水)】
ライトニングトーク①  奇数番号 15:10 ~ 15:50
ポスター発表①     奇数番号 15:50 ~ 17:10

【10月5日(木)】
ライトニングトーク②  偶数番号 10:30 ~ 11:10
ポスター発表②     偶数番号 11:10 ~ 12:30

・掲示場所
【ポスター番号 1~44】
 東京大学弥生講堂・アネックス セイホクギャラリー
【ポスター番号 45~80】
 東京大学弥生講堂・一条ホール前 ギャラリー

※発表者はこちら(ポスター様式、ポスター設置・撤去などのタイムスケジュール等)を
ご覧ください。

※ポスターや発表スライド等の著作権は、別途記載がない限り発表者・発表者の所属機関に
帰属します。
ポスター・スライド内の図や文言を転用する際には、著作者と話し合っていただくよう
お願いいたします。



番号   代表発表者 所 属 タイトル
1  山本泰智 情報・システム研究機構
ライフサイエンス統合データベースセンター
より良いLOD利用環境の実現に向けて
2  山口敦子 情報・システム研究機構
ライフサイエンス統合データベースセンター
LOD上の情報をクラス間関係で切り取る基盤技術開発
3  千葉啓和 情報・システム研究機構
ライフサイエンス統合データベースセンター
RDF利活用を促進するSPARQLライブラリ整備
4  川島秀一 情報・システム研究機構
ライフサイエンス統合データベースセンター
NBDC RDFポータル
5  片山俊明 情報・システム研究機構
ライフサイエンス統合データベースセンター
国際開発者会議BioHackathonの10年
6  櫛田達矢 科学技術振興機構
バイオサイエンスデータベースセンター
リンクトオープンデータを使ったJST化学物質情報の拡張
7  仲山慶 愛媛大学沿岸環境科学研究センター 化学物質の環境リスク評価・リスクコミュニケーションのためのデータベース統合利用の試み
8  金進東 情報・システム研究機構
ライフサイエンス統合データベースセンター
PubAnnotationとPubDictionariesで行う文献アノテーション
9  藤原豊史 情報・システム研究機構
ライフサイエンス統合データベースセンター
PubCaseFinder:症例報告を活用した希少疾患診断補助システムの構築
10  飯田啓介 情報・システム研究機構
ライフサイエンス統合データベースセンター
日本語Webコンテンツ「新着論文レビュー」とほかのコンテンツとの連携
11  中村保一 情報・システム研究機構 国立遺伝学研究所
DDBJ センター
DDBJ
12  仲里猛留 情報・システム研究機構
ライフサイエンス統合データベースセンター
NGSの公共データベースSRA:10年目の機能拡張におけるBioProject/BioSampleとの連携
13  川本祥子 情報・システム研究機構
国立遺伝学研究所
第4期ナショナルバイオリソースプロジェクトの紹介
14  沖 真弥 九州大学大学院医学研究院 ChIP-Atlas: 公共ChIP-seqデータの統合データベース
15  大田達郎 情報・システム研究機構
ライフサイエンス統合データベースセンター
公共NGSデータレポジトリから再解析に適したデータセットを取得する
16  川路英哉 理化学研究所 情報基盤センター 国際的ゲノミクスデータ統合のアジア拠点: The Asian Mirror of the UCSC Genome Browser Database
17  箕輪真理 情報・システム研究機構
ライフサイエンス統合データベースセンター
生命科学研究のワンストップサービス:JBIポータルサイトの開設
18  内藤雄樹 情報・システム研究機構
ライフサイエンス統合データベースセンター
GGGenome & CRISPRdirect:ゲノム編集の実験を支援するための塩基配列検索ツール
19  横井翔 農研機構 生物機能利用部門 ゲノムDBやウェブコンテンツを活用して昆虫研究を進める - 遺伝子同定からスキルアップまで-
20  内山郁夫 自然科学研究機構
基礎生物学研究所
MBGD 2017: 大規模な微生物ゲノムデータのより効果的な比較に向けた改良
21  藤澤貴智 情報・システム研究機構
国立遺伝学研究所
CyanoBase: 大規模更新とユーザコミュニティ連携
22  森宙史 情報・システム研究機構
国立遺伝学研究所
微生物統合データベースMicrobeDB.jpの高度実用化開発
23  岩崎渉 東京大学大学院 理学系研究科 魚類ミトコンドリアゲノムデータベースMitoFish
24  藤博幸 関西学院大学 理工学部 ASHViewerの開発
25  栗栖源嗣 大阪大学 蛋白質研究所 蛋白質構造データバンク(PDBj)の検証高度化と統合化
26  小林直宏 大阪大学 蛋白質研究所 PDBj-BMRBにおける統合化データベースの取り組み: 高度なWEB検索表示機能への応用
27  太田元規 名古屋大学大学院 情報学研究科 天然変性タンパク質データベースIDEAL
28  塩生真史 長浜バイオ大学 バイオサイエンス学部 Het-PDB Navi2: タンパク質 - 低分子複合体構造から得られる相互作用部位のデータベース
29  荒川和晴 慶應義塾大学 先端生命科学研究所 超高機能構造タンパク質データベースの開発
30  山田一作 野口研究所 糖鎖科学ポータルにおける化学構造を活用したデータベース連携
31  矢木宏和 名古屋市立大学大学院 薬学研究科 糖鎖構造解析を支援するためのGALAXYデータベース
32  新町大輔 創価大学 国際糖鎖構造リポジトリと糖鎖関連データベースとの連携
33  安形清彦 グライコバイオマーカー・リーディング・イノベーション株式会社 糖タンパク質の機能解析に必須な糖鎖関連データベースのセマンティックウェブ化と国際化(ACGG-DB)
34  奥田修二郎 新潟大学大学院 医歯学総合研究科 糖鎖構造に対する自動アノテーションシステムの開発
35  田辺麻央 京都大学 化学研究所 がんのシグナル伝達ネットワークバリアントのデータベース
36  小川哲平 三井情報株式会社 拡張代謝パスウェイデータベース「M-path」の構築
37  遠里由佳子 理化学研究所 生命システム研究センター
発生動態研究チーム
SSBD:国内連携、国際連携およびデータリポジトリ
38  京田 耕司 理化学研究所 生命システム研究センター
発生動態研究チーム
BDML/BD5:生命現象の時空間動態に対する定量データの統合フォーマット
39  ホー ・ケネス 理化学研究所 生命システム研究センター
発生動態研究チーム
SSBD:生命現象の時空間動態に対する定量データと画像データの統合データベース
40  信定知江 科学技術振興機構
バイオサイエンスデータベースセンター
Integbioデータベースカタログの拡張
41  福井一彦 産業技術総合研究所 創薬分子プロファイリング研究センター 経済産業省関連ライフサイエンス・ポータルサイト MEDALS
42  坂手龍一 医薬基盤・健康・栄養研究所 臨床試験情報から探る難病創薬のトレンド
43  樋口千洋 医薬基盤・健康・栄養研究所
バイオインフォマティクスプロジェクト
創薬・疾患研究のためのデータベース検索システム Sagace
44  大波純一 科学技術振興機構
バイオサイエンスデータベースセンター
生命科学系研究データ循環基盤としてのアーカイブと横断検索
45  三橋 信孝 科学技術振興機構
バイオサイエンスデータベースセンター
TogoVar(日本版変異統合DB)の開発
46  満山進 慶應義塾大学 医学部 がん関連疾患遺伝子/タンパク質相互作用データベースCancerProView
47  武田淳一 名古屋大学大学院 医学系研究科 SNVから疾患を予測するツールiMSVMの開発
48  土方敦司 長浜バイオ大学 バイオサイエンス学部 Mutation@A Glance: ヒト遺伝子バリアント統合可視化ツール
49  坊農秀雅 情報・システム研究機構
ライフサイエンス統合データベースセンター
公共オミックスデータ検索とそれを活用したデータ解析支援
50  田高周 東北大学 東北メディカル・メガバンク機構 jMorp: 日本人多層オミックス参照パネル
51  田中啓太 三井情報株式会社 多層的疾患オミックス解析のための統合データベース ”iDOx DB”
52  鈴木穣 東京大学大学院 新領域創成科学研究科 疾患ヒトゲノム変異の生物学的機能注釈を目指した多階層オーミクスデータの統合
53  杉本竜太 情報・システム研究機構
国立遺伝学研究所
dbHERV-REs:ヒト内在性レトロウイルス由来転写調節エメレントデータベースの構築
54  河野信 情報・システム研究機構
ライフサイエンス統合データベースセンター
GA4GH Genomics API によるマルチオミクスデータ統合検索
55  河野信 情報・システム研究機構
ライフサイエンス統合データベースセンター
寄託データを対象とした秘匿検索の試験的実装
56  河野信 情報・システム研究機構
ライフサイエンス統合データベースセンター
各種レポジトリに登録されたメタデータを収集した OmicsDI の RDF 化
57  奥田修二郎 新潟大学大学院 医歯学総合研究科 jPOST:プロテオーム統合データベースプロジェクト
58  小林大樹 熊本大学大学院 生命科学研究部 jPOST:メタデータのキュレーション
59  吉沢明康 京都大学大学院 薬学研究科 jPOST: 再解析プロトコルによる同定結果の質的向上
60  守屋勇樹 情報・システム研究機構
ライフサイエンス統合データベースセンター
jPOST データベースの開発
61  松本雅記 九州大学 生体防御医学研究所 jPOST: タンパク質発現絶対量sliceの開発
62  坂田克己 前橋工科大学 ダイズプロテオームデータベース:電気泳動を基盤にした手法と質量分析計を基盤にした手法から得られたタンパク質データの統合
63  小野浩雅 情報・システム研究機構
ライフサイエンス統合データベースセンター
遺伝子発現リファレンスデータセット RefEx
64  野口修平 理化学研究所
ライフサイエンス技術基盤研究センター
The FANTOM web resource
65  佐藤明 東京理科大学 理工学部 脳トランスクリプトームデータベースBrainTx ‐脳神経遺伝子発現情報の統合化‐
66  川本宗孝 東京大学大学院 農学生命科学研究科 「SilkBase」カイコとその近縁種のトランスクリプトーム統合データベース
67  中武悠樹 慶應義塾大学 医学部 ヒトES細胞における網羅的な転写因子誘導株の樹立とその発現解析
68  平川英樹 かずさDNA研究所 植物ゲノム統合データベースPGDBjの構築
69  市原寿子 大阪大学大学院 医学系研究科 種を超えたゲノム情報統合のためのデータリンク基盤の構築
70  真野昌二 自然科学研究機構 基礎生物学研究所 植物オルガネラ画像のデータベースPODBの構築と改良の取り組み
71  山本義治 岐阜大学大学院 連合農学研究科 ppdb, Plant Promoter Database
72  黒谷篤之 理化学研究所 環境資源科学研究センター 植物におけるタンパク質の総合アノテーションデータベースの開発
73  河野徳昭 医薬基盤・健康・栄養研究所
薬用植物資源研究センター
生薬国産化へ ―薬用植物総合情報データベースの構築―
74  桝屋啓志 理化学研究所 バイオリソースセンター モデル生物表現型の統合データベース J-Phenome
75  久米 慧嗣 理化学研究所
ライフサイエンス技術基盤研究センター
生命科学系超微細構造画像データを運用する統合メタデータベースの構築
76  小林紀郎 理化学研究所 情報基盤センター 理研メタデータベース:分野を超えたデータ駆動型研究を支えるメタデータ利活用基盤
77  鈴木智広 理化学研究所 バイオリソースセンター 表現型データウェブ公開サポートシステム「Pheno-Pub」を用いた日本マウスクリニック網羅的表現型情報の公開
78  山根順子 京都大学 iPS細胞研究所 1細胞解析に有効なヒト細胞情報データベース「SHOGoiN」
79  荒木正健 熊本大学生命資源研究・支援センター 可変型遺伝子トラップクローンデータベース「EGTC」の開発及び解析
80  女屋博昭 国立がん研究センター がん対策情報センター がん診療画像レファレンスデータベースの現状



ポスター発表詳細(ポスター情報)

番 号 1
タイトル より良いLOD利用環境の実現に向けて
発表者 ○山本泰智、山口敦子
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  ライフサイエンス統合データベースセンター(DBCLS)では生命科学分野の様々なデータベースをより使いやすくするための技術基盤としてResource Description Framework(RDF)の利用を推進している。RDF データベースに対しては標準問い合わせ言語のSPARQL を用いて所望のデータを取得するが、各データベースの所在や構造、信頼性などを容易に知る手段が無いという問題がある。そこで、所望のRDF データの所在を検索し、データ構造を把握し、信頼性を知ることができるようなサービス群、Umaka Suiteを開発している。一部のサービスについてはすでにDBCLSの提供する他のサービスで利用されている。そこで、ポスターではサービス全体の説明や現状の課題などを紹介する。
発表資料      doi:10.18908/togo2017.p001
番 号 2
タイトル LOD上の情報をクラス間関係で切り取る基盤技術開発
発表者 ○山口敦子1), 小林紀郎2), 山本泰智1), 桝屋啓志3), 古崎晃司4)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター 2)理化学研究所 情報基盤センター
3)理化学研究所 バイオリソースセンター 4)大阪大学 産業科学研究所
要 旨  これまで発表者らは、SPARQL 言語の知識がなくとも、また、対象データセットの構造を知らなくても、クラス間関係提示を用いた対話的なGUI を介してSPARQL クエリを生成することができるウェブ上のサービスSPARQL Builder を開発してきた。このツールの本質的な動作は、LOD 上の情報をクラス間関係で切り取り、ユーザが着目したLOD データを取得させることである。今年度からは、これまで開発してきた要素技術を整理し、ツールとしてより一層発展させるために、SPARQL クエリ生成にとどめることなく、LOD 上の情報を自在に切り取るための直観的なGUI を備えた基盤構築を進めている。そのため、連合検索やメタデータ整備などの必要な技術開発を加え、分散データセットの統合利用が可能となるよう開発をすすめていく予定である。本発表では、これまでに開発した技術と必要となる技術を紹介し議論しつつ、今後の展望について述べる。
発表資料      doi:10.18908/togo2017.p002
番 号 3
タイトル RDF利活用を促進するSPARQLライブラリ整備
発表者 ○千葉啓和
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  生物情報データベースの相互運用性を高めるため、これまで国内外においてSemantic Web技術の活用が進められてきた。RDF 化されたデータベースを組み合わせて、適切な情報を抽出するために、クエリ言語SPARQL が用いられる。しかしながら、幅広いユーザーのニーズに応えるためには、SPARQL の活用をより容易にするための環境整備が必要である。その ため、汎用SPARQL クライアントSPANG[1] を開発するとともに、有用なSPARQL クエリをライブラリとして整理している。リソースに対してURIを割り当て、データ共有を促すだけでなく、クエリに対してもURIを割り当てることによって、データの解釈方法についても共有を促す。こうしたSPARQL ライブラリを組み合わせることで、複数のエンドポイントを利用した検索も可能となっている。既存の環境と比較したperformanceや再利用性の向上について、具体例をもとに議論する。

[1] Chiba H, Uchiyama I. BMC Bioinformatics 18:93, 2017
発表資料      doi:10.18908/togo2017.p003
番 号 4
タイトル NBDC RDFポータル
発表者 ○川島秀一1)、片山俊明1)、畠中秀樹2)
所 属 1) 情報・システム研究機構 ライフサイエンス統合データベースセンター
2) 科学技術振興機構 バイオサイエンスデータベースセンター
要 旨  NBDC RDF ポータルは、2015年11月より運用が開始された、国内で開発された生命科学RDF データを収集したサービスである。RDFデータ同士は、形式(シンタックス)としては、すぐに統合して利用することが可能であるが、意味(セマンティクス)のレベルでの統合を行うためには、用いる語彙・オントロジーや、データを表現するモデルが共通化している必要がある。 異なる研究分野の開発グループにより独立に開発されたRDF データ間で、そのような共通化を期待することは現実的ではない。RDFポータルでは、DBCLSデータベースRDF 化ガイドラインを利用して、RDFを収録する際にはレビューを行い、必要に応じて開発者にはRDF の修正も依頼することで、一定の意味レベルの共通化を達成してきた。また、RDF データ収録後も、随時データのキュレーションや、ガイドラインの見直しを行うことで、より相互運用性の高いRDF データを提供できる環境整備に努めている。このようなRDFポータルの現状について報告したい。
発表資料      doi:10.18908/togo2017.p004
番 号 5
タイトル 国際開発者会議BioHackathonの10年
発表者 ○片山俊明1)
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  ライフサイエンス統合データベースセンター(DBCLS)では2008年から国際開発者会議BioHackathon を開催してきた。この間、無数にある生命科学のデータベースを統合的に利活用するための技術開発を進め、近年ではセマンティック・ウェブ技術による多種多様なデータのRDF としての統合に繋がってきている。データベースに国境はないため、このような標準化には国際連携が欠かせない。BioHackathon は、毎年1週間に渡って合宿形式で開催することにより、標準化に必要となる国際的な人的ネットワークと信頼関係の形成を促進してきた。とくに、現場で活躍する研究者・技術者の参加を重視しており、最先端の技術交流を行うと同時に、会期中にソフトウェア開発を行うことによって課題解決を進める実務的な会を目指してきた。一方で、ハッカソンというユニークな形式の会議を主催し、国際的な参加者を1週間に渡りホストする運営にも様々なノウハウが求められてきた。10年目を迎える今年、これまでの成果と今後の方向性について総括する。
発表資料      doi:10.18908/togo2017.p005
番 号 6
タイトル リンクトオープンデータを使ったJST化学物質情報の拡張
発表者 ○櫛田達矢1)、渡邊勝太郎2)、松邑勝治2)
所 属 1) 科学技術振興機構 バイオサイエンスデータベースセンター 2) 科学技術振興機構 情報企画部
要 旨  ChEBI やDBpedia、Bio2RDF などのリンクトオープンデータ(LOD)を使って、JST の化学物質情報(NikkajiRDF)をハブとして統合している各データベースの化合物に対するロール、主題、相互作用情報などの知識の付加、推論を行った。ChEBI では、その化合物クラス(例 acetylsalicylic acid)を、あるロール(例 non-steroidal anti-inflammatory drug)を持つ化合物として定義したOWL 形式のデータを提供している。一方、NikkajiRDF では化合物構造情報の識別子InChIをキーとしてChEBIなど10数種類のデータベースの化合物間のマッピング情報を提供している。両者をトリプルストアに格納しSPARQLを実行することで、化合物に対するChEBIのロールの付加およびその上位概念のロールの推論が可能になった。その結果、16,583件のNikkajiRDF の化合物に対して954件のChEBI のロールが付与もしくは推論された。その他、同様な手法でNikkajiRDF、KNApSAcK、KEGG COMPOUND, Open TG-GATEs化合物などに対して、ChEBIのLipidのサブカテゴリー、DBpediaの主題およびDrugBank(Bio2RDF)の相互作用の情報の付与、推論が可能になった。
発表資料      doi:10.18908/togo2017.p006
番 号 7
タイトル 化学物質の環境リスク評価・リスクコミュニケーションのためのデータベース統合利用の試み
発表者 ○仲山慶1)、林彬勒2)、神保宇嗣3)、細矢剛3)、国末達也1)、白石寛明4)
所 属 1) 愛媛大学 沿岸環境科学研究センター 2) 産業技術総合研究所 3) 国立科学博物館 4)国立環境研究所
要 旨  化学物質の環境リスクは、基本的に予測環境濃度(PEC)と予測無影響濃度(PNEC)の比に基づいて評価される。PEC は環境中の化学物質濃度の実測データ等をもとに推定される環境中濃度だが、実測データが無い場合は排出量から推定される。一方、PNEC は生物試験から得られる毒性値を不確実性係数で除したものである。近年、化学物質の環境リスク評価の迅速化や、動物実験の代替や削減の必要性から、これまでに得られたデータを利用した化学物質の暴露および有害性評価の重要性が高まっている。そこで我々は、環境中の化学物質濃度情報を収録したChemTHEATRE および化学物質の有害性情報を収録した生態リスク評価管理ツールAIST-MeRAM を利用し、それぞれからPEC およびPNEC 情報を抽出し、簡便かつ透明性の高いリスク評価を試みている。また、ChemTHEATRE と生物多様性情報(GBIF)や生物試料バンク(es-BANK)のデータベースとの連動による、標本情報の取得や化学物質の影響解析なども可能としたい。また、AIST-MeRAM と環境省の請負で国立環境研究所が開発した生態毒性QSAR システムKATE との連動によって、有害性情報のない化学物質のPNEC を導出できるため、これまでリスク評価できない物質も評価可能になった。以上のように、環境系データベースの統合利用により、次世代的環境リスク評価およびリスクコミニュケーションを推進したいと考えている。
発表資料      doi:10.18908/togo2017.p007
番 号 8
タイトル PubAnnotationとPubDictionariesで行う文献アノテーション
発表者 ○金進東、王悦
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  信頼性および活用性が高い知識ベースを構築するためには、各々の知識記述に対して、根拠となるデータを、出版された科学文献からマイニングする必要がある。また、科学文献を効率的にマイニングするためには多様な情報を使い、大量な文献をアノテーションし、検索可能な状態にしておく必要がある。しかしながら、一般に、大量の文献をアノテーションするためには、文献の内容に関する専門的な知識に加え、言語処理のスキルと長時間の人手の作業が要求される。様々な情報を使って大量の文献アノテーションを行う時に必要な言語処理の過程を自動化し、誰でも使えるウェブサービスとして提供するため、PubAnnotation とPubDictionaries の2つのサービスを開発した。PubAnnotation を使うことにより、アノテーションする文献の準備と管理ができ、PubDictionaries を使うことにより、アノテーションに使う辞書の開発を管理できる。2つのサービスを繋ぎ、有効に使うことで大量な文献への多様なアノテーションが簡単にでき、アノテーションの結果のデータの検索もSPARQL を利用することで可能である。本発表ではこの二つのサービスを使って文献アノテーションデータを開発する方法と活用例を紹介する。
発表資料      doi:10.18908/togo2017.p008
番 号 9
タイトル PubCaseFinder:症例報告を活用した希少疾患診断補助システムの構築
発表者 ○藤原豊史1),2)、山本泰智1)、金進東1)、高木利久2)
所 属 1) 情報・システム研究機構 ライフサイエンス統合データベースセンター 2)東京大学
要 旨  近年、エキソーム解析などの次世代シーケンサーを用いた遺伝学的検査が希少疾患の未診断患者を対象に実施され、診断率が向上している。エキソーム解析で得られた多数のバリアントを、バリアントの頻度や病原性を評価することで数十から数百に絞り込み、それらの中に既知の疾患原因遺伝子(バリアント)が存在するかを確認する。一方で、患者の症状と類似性の高い症状が報告されている疾患をOrphanetなどの疾患データベースから検索し、その結果を合わせて絞り込んだバリアントが病因となりうるかを評価する。しかし、Orphanetは疾患に関連する症状を手動で集めているためにカバー率が低いことが問題となっている。そこで我々は、PubMedに登録されている100万件以上の症例報告から疾患に関連する症状を網羅的に抽出し、そのデータを活用した希少疾患診断補助システム「PubCaseFinder」を構築した。我々が作成したデータベースはOrphanetが含んでいない情報を数多く含み、Orphanetを活用する既存の検索システムよりも高い精度で類似する疾患を検索できる。構築したデータベース・システム、その評価、および今後の展望について報告する。
発表資料      doi:10.18908/togo2017.p009
番 号 10
タイトル 日本語Webコンテンツ「新着論文レビュー」とほかのコンテンツとの連携
発表者 ○飯田啓介、小野浩雅、山本泰智
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  ライフサイエンス統合データベースセンターは、2010年9月より、日本語Webコンテンツとして「ライフサイエンス 新着論文レビュー」を公開している。これは、トップジャーナルに掲載された日本人を著者とする生命科学分野の論文について、論文の著者自身の執筆による日本語のレビューを、だれでも自由に閲覧・利用できるよう、いち早く公開するもので、すでに1100本以上が公開されている。今回、ほかのコンテンツとの連携として、関連する基礎知識の解説のため、生命科学の教科書“A Comprehensive Approach To LIFE SCIENCE”(羊土社『理系総合のための生命科学 第2版』英語版)の関連する節へのリンクを設けた。このことにより、読者の利便性が高まるとともに、「新着論文レビュー」が単なる解説記事としてだけでなく、データベースやテキストなどさまざまなコンテンツのプラットホームへと発展する足がかりとなることが期待される。さらに、「新着論文レビュー」に記載されたタンパク質名や遺伝子名などから関連するデータベースにジャンプし、さまざまな情報を取得できるよう、サイトのリニューアルを準備している。
発表資料      doi:10.18908/togo2017.p010
番 号 11
タイトル DDBJ
発表者 ○中村保一
所 属 情報・システム研究機構 国立遺伝学研究所DDBJセンター
要 旨  本年開設30周年を迎えたDDBJ(http://www.ddbj.nig.ac.jp)はNCBI、EBI とともに International Nucleotide Sequence Database Collaboration(INSDC)を構成し塩基配列アーカイブと解析リソースの提供を実施している。INSDCの伝統的な配列DB(GenBank、ENA、DDBJ)は874万エントリー・2兆4千億塩基を超え、新型シーケンサ由来データDB のSequence Read Archive(SRA)は相互にデータ交換しているオープンアクセスデータとしては5千兆(5ペタ)バイトを超えるデータ量となっている。本ポスターでは明るい話題としてのDBCLSとの連携強化による開発状況について、またDDBJが直面する問題として中国BIG Data Centerの公開したSRAと同一のネームスペースを用いたGSAデータベース問題への対応など、DDBJの進捗と今後の展望などを紹介し議論する。
番 号 12
タイトル NGSの公共データベースSRA:10年目の機能拡張におけるBioProject/BioSampleとの連携
発表者 ○仲里猛留1)、大田達郎1)、児玉悠一2)、坊農秀雅1)
所 属 1) 情報・システム研究機構 ライフサイエンス統合データベースセンター
2) 情報・システム研究機構 国立遺伝学研究所DDBJ センター
要 旨  NGS(次世代シーケンサー)データの公共データベースであるSRA(Sequence Read Archive)ができて約10年たち、いまや10万プロジェクトに5000兆塩基対(≒5PB)が収載されるまでに成長した。この間に新しいシーケンサーも登場し、データベース自体もさまざまな機能や仕様の拡張がなされてきた。そこで今回、DBCLS とDDBJ の両者で協力し、こ れまで構築してきたデータベース/ ウェブサービスの大規模な改修に取り組んでいる。研究者がNGS データを登録すると、その実験情報(メタデータ)はSRA だけでなく、BioProject やBioSample にも登録され、発現データの場合GEO/ArrayExpressにも情報が記載される。そのため、利用する側にとっては、異なるデータベースでIDの対応を取り、自身でデータを検索・統合する必要があった。そこで我々はあらかじめ分散して記載された情報を対応づけ、包括的に情報を表示できるよう開発を行っている。また同様にNGSデータを用いて発表された論文も対応づけ、検索の対象としている。
発表資料      doi:10.18908/togo2017.p012
番 号 13
タイトル 第4期ナショナルバイオリソースプロジェクトの紹介
発表者 ○川本祥子、木村学、渡邉融、土屋里枝、渡辺拓貴、神山春風、萩原宏紀、吉岡美春、佐賀正和、小松まり子
鈴木栄美子、木村紀子、安井香織
所 属 情報・システム研究機構 国立遺伝学研究所生物遺伝資源センター
要 旨  ナショナルバイオリソースプロジェクト(NBRP)は平成14年にスタートし15年以上続く、基礎科学系ではたいへん長寿のプロジェクトの一つである。現在、理研バイオリソースセンター(BRC)と全国の大学・研究機関をあわせて30の拠点が、モデル生物の維持管理、分譲、寄託の業務を担っている。NBRP の全リソース数は650万、リソースを利用・寄託した論文は2万報にのぼるなど、ライフサイエンス研究のなくてはならない基盤として成長した。プロジェクトは2017年度から第4期を迎え、さらなる利用者の拡大、ゲノム編集など新技術によるリソース開発等が求められている。NBRP 情報センターはこれまで、プロジェクトの中心として、各拠点の情報整備を支援し、リソース管理サイトの構築や、ウェブサイト公開などの業務を担ってきた。また、リソース情報の一括検索や、成果論文データベースの構築など、情報の統合化を進めてきた。今後は、生物横断的な情報の統合化や、急増するゲノム情報の活用が課題であり、統合データベースプロジェクトとの連携や技術の導入が求められている。第4期を迎えたNBRPの現状と課題を報告する。
発表資料      doi:10.18908/togo2017.p013
番 号 14
タイトル ChIP-Atlas: 公共ChIP-seqデータの統合データベース
発表者 ○沖真弥1)、大田達郎2)、塩井剛3)、畠中秀樹4)、小笠原理5)、奥田喜広5)、川路英哉6)、仲木竜7)、瀬々潤8)
目野主税1)
所 属 1) 九州大学大学院 医学研究院 2)情報・システム研究機構 ライフサイエンス統合データベースセンター
3) 理化学研究所 ライフサイエンス技術基盤研究センター 4) 科学技術振興機構 バイオサイエンスデータベースセンター
5) 情報・システム研究機構 国立遺伝学研究所DDBJ センター 6) 理化学研究所 情報基盤センター
7) 東京大学 先端科学技術研究センター 8) 産業技術総合研究所 人工知能研究センター
要 旨  ChIP-seq は転写因子や修飾ヒストンの分布をゲノムワイドに理解するための強力な実験手法であり、これまでに約5万件以上の実験データがNCBI SRA に登録されている。しかし、その公共データを解釈するためには複雑なコマンド処理と大規模な計算資源が必要なため、その多くのデータが利活用されずに死蔵されているのが現状である。そこで我々はその公共ChIP-seq データを網羅的に収集、計算、統合し、その解析結果をウェブサービスとして公開している(ChIP-Atlas;http://chip-atlas.org)。これにより、興味のゲノム領域にどの転写因子が結合するかが視覚的に理解できる。また、興味の転写因子とゲノム上で共局在する因子や、その標的遺伝子を予測することも可能である。また我々はこの膨大なデータを統合的に解析した結果、組織特異的エンハンサーや、疾患と関連するnon-coding SNP の周辺において、高頻度に結合する転写因子を複数同定した。これらの知見は細胞運命決定機構や難病メカニズムの解明に活用できる。
発表資料      doi:10.18908/togo2017.p014
番 号 15
タイトル 公共NGSデータレポジトリから再解析に適したデータセットを取得する
発表者 ◯大田達郎、仲里猛留、坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  NGS の技術革新と普及により、公共のNGS データレポジトリに登録されるデータの数と量は爆発的に増加している。それに伴い、既報のデータを再利用し研究に活用するケースが増えている。しかし、大規模なデータレポジトリから再利用に適したデータセットを取得するためには、実験や生物種などのメタデータだけでは不十分である。DBCLS Quanto[1] は、NGSデータのリード長やリード数などの性質とベースコール精度などのクオリティ情報を計算することで構築されたデータベースである。データはRDF 化され、他のRDF データと接続することで、研究者それぞれの要望に応じたデータセットとその付随情報の取得を可能にする。本発表では、レポジトリからの柔軟なデータ取得を可能にする技術と、これにより可能となったデータ再解析の事例について紹介する。

[1] Ohta T et al. gigascience( 2017) https://doi.org/10.1093/gigascience/gix029
発表資料      doi:10.18908/togo2017.p015
番 号 16
タイトル 国際的ゲノミクスデータ統合のアジア拠点: The Asian Mirror of the UCSC Genome Browser Database
発表者 ○川路英哉1),2)
所 属 1) 理化学研究所 情報基盤センター 2) 理化学研究所 予防医療・診断技術開発プログラム
要 旨  次世代シーケンサーより産出された生データは国際レポジトリ(SRA, ERA, DRA)に登録されているが、これを効果的に利用する為にはゲノム軸上の情報(変異情報やシグナル強度)への変換が必要である。主要な国際的大規模プロジェクト(1000人ゲノムプロジェクト、ENCODEプロジェクト、国際エピゲノムコンソーシアム(IHEC)、FANTOM5プロジェクト、等)はいずれも、変換処理済データをすぐさま利用できるよう、カリフォルニア大学サンタクルス校の開発するThe UCSC Genome Browser Database が提案するTrack Data Hub 方式を用いたデータ共有を進めており、本方式での共有は実際上、ゲノミクスデータを常に扱う研究者にとってデータ流通のデファクトスタンダードである。そこで米国で運営されているThe UCSC Genome Browser Database 開発チームと共同し、これのアジアミラーを日本に立ち上げた。本ゲノミクス情報流通基盤の構築によって、アジアの研究者、特に日本の研究者によるゲノミクス情報の発信・利用の促進が期待される。
発表資料      doi:10.18908/togo2017.p016
番 号 17
タイトル 生命科学研究のワンストップサービス:JBIポータルサイトの開設
発表者 〇箕輪真理1),2)、小野浩雅1)、金城玲3)、中村保一4)、畠中秀樹2)
所 属 1) 情報・システム研究機構 ライフサイエンス統合データベースセンター
2) 科学技術振興機構 バイオサイエンスデータベースセンター
3) 大阪大学 蛋白質研究所日本蛋白質構造データバンク 4)情報・システム研究機構 国立遺伝学研究所DDBJセンター
要 旨  JBI(Japan alliance for Bioscience Information)ポータルサイトは、DNA Data Bank of Japan(DDBJ)、日本蛋白質構造データバンク(PDBj)、バイオサイエンスデータベースセンター(NBDC)、ライフサイエンス統合データベースセンター(DBCLS)が提供する、生命科学研究の様々な場面で役立つデータベースやツールのサービスを1か所から発信するために開設されました。
 巨大なデータセンターに生命科学データベースが集約されている米欧の状況に比べ、わが国では、データベースの共有に関する活動は、共有のためのプロジェクト実施機関(DBCLS やNBDC)および世界的なデータ共有の一翼を担ってきた機関(DDBJ, PDBj)などで、それぞれの役割や目的のもと実施されています。しかしこの状態はデータベースの利用者にとっては、非常にわかりにくく、使いにくいもので、データの利活用の大きな妨げになっていると思われます。本サイトは、そのような状況の改善を目指した「ワンストップサービス」の試みです。
http://jbioinfo.jp/
発表資料      doi:10.18908/togo2017.p017
番 号 18
タイトル GGGenome & CRISPRdirect:ゲノム編集の実験を支援するための塩基配列検索ツール
発表者 ○内藤雄樹、坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  CRISPR/Cas9システムの実験を支援するウェブツールとして、われわれが公開している高速塩基配列検索GGGenome(http://GGGenome.dbcls.jp/)およびガイドRNA 設計ソフトウェアCRISPRdirect(http://crispr.dbcls.jp/)を紹介する。GGGenome は、20塩基程度の短い配列をゲノム全体から高速に検索できる。とくに、ミスマッチや挿入・欠失を含む配列であっても検索漏れがなく、ガイドRNA の特異性を確認するために役立つ。CRISPRdirect は、GGGenome による検索機能を利用することにより、特異性の高いガイドRNA を簡便に設計できるツールである。昨年以降のアップデートでは、ゲノム情報を拡充し、日本人基準ゲノムJRGv2、マウスゲノムMSMv3/JF1v2、CyanoBase に収録された多数のシアノバクテリアゲノム、各種の実験動植物や作物のゲノムを追加することにより総計約350種のゲノムに対応したほか、ガイドRNAの標的部位に制限酵素サイトがあるか確認できるようにするなど、利用者の要望をもとに機能の改良を行なった。
発表資料      doi:10.18908/togo2017.p018
番 号 19
タイトル ゲノムDBやウェブコンテンツを活用して昆虫研究を進める - 遺伝子同定からスキルアップまで-
発表者 ○横井翔
所 属 農業・食品産業技術総合研究機構 生物機能利用研究部門
要 旨  発表者は学生の時にゲノムが解読されていない非モデル昆虫からゲノムが解読されておりゲノム DB が公開されている。
 昆虫に材料を替え、ゲノム情報を活用しながら研究を行った。ゲノム情報やゲノムDB があることの優位性に驚きながら免疫関連遺伝子の研究を進めた。学位取得後、NGS を使った昆虫の研究を行いたいと思い、でバイオインフォマティクスの勉強を始めた。その過程で、NBDC のNGS 速習講習会の存在を知り、さらにDBCLS が提供しているTogoTV も利用しながらバイオインフォマティクスのトレーニングを行った。
 このようなコンテンツや講習会を大いに活用することで、自分のスキルを高め、幸いにして、現在発表者は昆虫を材料に したNGS 解析がメインのポジションを得ている。このようにゲノムDB ばかりでなく、非ゲノムDB であるウェブコンテンツの活用が発表者のこれまでの研究生活において、研究推進、スキルアップ、はたまたキャリアアップに重要な役割を果たしていると確信している。本発表は発表者の研究の中でのゲノムDB やウェブコンテンツの活用例を紹介しつつ、これからのゲノムDBやウェブコンテンツのあり方を議論したい。

横井 翔 昆虫研究におけるゲノム情報の利用(私の研究の歴史を例に)(2016)NIG joint DOI: 10.7875/togotv.2016.178
発表資料      doi:10.18908/togo2017.p019
番 号 20
タイトル MBGD 2018: 大規模な微生物ゲノムデータのより効果的な比較に向けた改良
発表者 ○内山郁夫1)、三原基広2)、西出浩世1)、千葉啓和3)
所 属 1) 自然科学研究機構 基礎生物学研究所 2)株式会社ダイナコム
3) 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  微生物比較ゲノムデータベースMBGD では、大規模データに基づく比較ゲノム解析の基盤として、既知の微生物ゲノム間のオーソログデータの構築を行っている。最新版では、1019属、2548種に属する6318株の完全ゲノムが収録されている。近縁比較から遠縁比較まで、様々な比較解析に対応させるため、MBGD ではゲノムが決定された微生物の全系統群にまたがる比較のための標準オーソログテーブルに加えて、各系統群に特異的なオーソログテーブルを作成している。従来の標準オーソログテーブルは、属当たり1つの代表ゲノムをとって作成していたため、代表ゲノムに含まれない遺伝子が比較対象とならないという問題があった。これを解決するため、種内比較、属内比較、属間比較を段階的に行い、下位の系統群内の比較から得られた各系統群の遺伝子レパートリー全体(パンゲノム)を、上位の比較の入力に用いるというアプローチにより、全遺伝子レパートリーを網羅するオーソログテーブルの構築を行った。また、ユーザのクエリ配列に対して、HMM 検索によってオーソロググループを対応付ける機能や、各系統群のコア遺伝子の連結配列によって作成した系統樹を表示する機能などを加えた。MBGDのコアデータはRDF化されており、これを検索するためのSPARQLインターフェイスも備えている。
発表資料      doi:10.18908/togo2017.p020
番 号 21
タイトル CyanoBase: 大規模更新とユーザコミュニティ連携
発表者 ○藤澤貴智、中村保一
所 属 情報・システム研究機構 国立遺伝学研究所
要 旨  CyanoBase(http://genome.microbedb.jp/cyanobase)は、1996年シアノバクテリアゲノム配列が決定されると共に、アノテーション情報を提示するためのデータベースとして開発され、このゲノム情報をより効率的に使用できるようにウェブサービスとして提供された。以降、いくつかのアップデートを経てCyanoBase は常に拡張され、20周年を迎えた昨年、セマンティック・ウェブ技術を用いたCyanoBase 更新系を整備すると共に、データベースの新しい大規模な更新について報告した。本発表では、継続的な更新整備およびコミュニティベースのアノテーションリソースの拡張・再利用に関するCyanoBase の最新動向について報告すると共に、ユーザコミュニティとの連携を図りながら、生物分類に関するメタデータについての拡張および藻類および植物ホロゲノムの研究への発展について議論したい。

[1] Fujisawa T et al. Nucleic Acids Res (2017) 45 (D1): D551-D554. doi: https://doi.org/10.1093/nar/gkw1131
発表資料      doi:10.18908/togo2017.p021
番 号 22
タイトル 微生物統合データベースMicrobeDB.jpの高度実用化開発
発表者 ○森宙史1)、藤澤貴智1)、鈴木真也2)、千葉啓和3)、東光一1)、神沼英里1)、西出浩世4)、矢口貴志5)、高橋弘喜5)
山田拓司2)、内山郁夫4)、中村保一1)、黒川顕1)
所 属 1) 情報・システム研究機構 国立遺伝学研究所 2) 東京工業大学 生命理工学院
3) 情報・システム研究機構 ライフサイエンス統合データベースセンター 4) 自然科学研究機構 基礎生物学研究所
5) 千葉大学 真菌医学研究センター
要 旨  我々はこれまで、細菌の各種オミックス情報を広く収集し、遺伝子、ゲノム、環境の3つの軸に沿って様々な知識を整理し、ゲノム情報を核としてセマンティックウェブ技術により統合した統合データベース(DB)MicrobeDB.jp」を開発してきた。本DB のような、全データがRDF により記述され連結された巨大なグラフになった統合DB では、利用者には巨大グラフの全貌が不明であるため、巨大グラフをどのように辿ればどのような答えが出てくるかを想定できず、これまでのDB の利用形態を適用することが本質的に困難となる。そこで本研究開発では、徹底的なデータ統合および高度化は維持しつつ、「統合化されたデータをどのように渡り歩き、どのような新規知見を得るか」という統合DBの利活用方法の開発に重点を置き、MicrobeDB.jp の高度実用化を目指す。本ポスター発表では、利用者からのニーズが強くMicrobeDB.jp の高度実用化の上で重要な環境情報の統合化を中心に発表する。MicrobeDB.jpのWebサイト: (http://microbedb.jp
発表資料      doi:10.18908/togo2017.p022
番 号 23
タイトル 魚類ミトコンドリアゲノムデータベースMitoFish
発表者 ○岩崎渉1),2),3)
所 属 1) 東京大学 大学院理学系研究科 2) 東京大学 大学院新領域創成科学研究科 3) 東京大学 大気海洋研究所
要 旨  生物資源の適切な保全や生物多様性の管理のため、また生物進化の歴史の解明のため、遺伝的情報に基づいた精緻な議論が不可欠となっている。こうした目的のための遺伝情報源として、動物において非常に有用なのがミトコンドリアDNA 配列である。特に近年ではいわゆる次世代シーケンサが開発・実用化されたことで、ミトコンドリアDNA の全長であるミトコンドリアゲノム配列をこれまでにない規模で解読することが可能になってきた。MitoFishデータベースはこの背景のもと、我が国にとっての重要生物資源でもあり、水圏生物界で重要な位置を占める魚類について、ミトコンドリアゲノム配列情報を該当種魚類の生息水域や生活史の情報と同時に活用しやすい形で提供することを目的としたデータベースである。世界で唯一の魚類ミトコンドリアゲノムデータベースとして、基礎生物学、魚類の保全や分類、さらには食品素材となる魚類の識別のための情報源として多方面で活用されており、今後は各種の国際的データベースと連携をはかりつつ、魚類進化史の完全解明など魚類多様性の全貌を把握するデータベースとして完成させることを目指している。

Iwasaki et al., Mol. Biol. Evol., 30, 2531-2540. (2013)
番 号 24
タイトル ASHViewerの開発
発表者 ○藤博幸、工藤高裕、山下鈴子
所 属 関西学院大学 理工学部
要 旨  モチーフの同定や系統樹の構築など様々なタンパク質の機能や構造の解析のために、配列や構造のアラインメントが行われている。現在、多くのアラインメントツールが開発され、 広く利用されている。PDBj でもASH をはじめとして、構造アラインメントのツールの開発や計算サービスが行われてきた。近年の配列決定技術の進歩に伴い、大量の配列データが蓄積されてきており、これらの配列データと構造を統合して、アラインメントに基づく解析を行うことは、配列のみ、あるいは構造のみを用いた解析に比べ、より有用な情報が得られるものと期待される。しかし、その得られたアラインメントから情報を抽出するにあたり、その大量性から、これまでのような視察に基づくデータの処理は困難になってきている。このため新規のビューア/エディターの開発も行われているが機能的に十分なものではない。今回、このような問題を解決すると同時に、統合データベース利用のプラットフォームとなりうるビューアの開発を進めており、その計画と進捗について発表する。
発表資料      doi:10.18908/togo2017.p024
番 号 25
タイトル 蛋白質構造データバンク(PDBj)の検証高度化と統合化
発表者 ○栗栖源嗣、中川敦史、鈴木博文、金城玲、中村春木
所 属 大阪大学 蛋白質研究所
要 旨  タンパク質、核酸、糖鎖などの生体高分子の立体構造情報はProtein Data Bank (PDB)として集積され、2017年6月には13万件を超える構造データを公開している。PDBj は、国際的組織であるwwPDB の一員として、我が国を中心とした急増するアジア圏からの登録を漏れなく編集する体制を構築し、全世界で共通した品質管理に基づいてデータ登録作業とデータ検証をおこなっている。また、PDBj 独自のダウンロードサービスの運用や、ツール類および二次DB の維持・提供をおこなってきた。これまでに、PDB コンテンツのセマンティック化が実施済みである。本年度から開始した新しい研究課題では、今後ますます重要となるデータ検証レポートのセマンティック化とその応用を実施し、利用者がゲノム等の他のデータベースとの統合的な利用の際に活用できる仕組みを構築する。さらに、分子内及び分子間の原子レベルないし残基レベルの相互作用情報を適切なオントロジーを付してRDF として公開することを目指し、製薬企業での化合物スクリーニングの際にPDBと併用される基盤化学データベースであるCSDとの統合化も進める。
発表資料      doi:10.18908/togo2017.p025
番 号 26
タイトル PDBj-BMRBにおける統合化データベースの取り組み: 高度なWEB検索表示機能への応用
発表者 ○小林直宏1)、横地政志1)、岩田武史1)、児嶋長次郎1),2)、藤原敏道1)
所 属 1)大阪大学 蛋白質研究所 2)横浜国立大学 理工学部
要 旨  大阪大学蛋白質研究所PDBj-BMRB グループは生体高分子の核磁気共鳴法(NMR)による貴重な実験データをBioMagResBank(BMRB)に登録アーカイブし、公開する活動を続けてきた。2017年6月の時点でNMR 構造、実験データの件数はそれぞれ11,000件を越え、これらデータの積極的な応用が進められている。
 NMR構造のProteinDataBank(PDB)への登録時にはデータ精度の評価としてValidation ReportがwwPDBにより発行されるが我々のグループはデータ交換フォーマットNEF の策定とその開発実装まで国際的な協力関係のもと取り組んでいる。また独自に開発したツールによりBMRB データのXML 化、RDF 化を行い、それらの応用としてWEB ポータルページで他の生命科学データベーベースとの連携により、高度な統合的検索機能を実現している。ポスター発表においては当グループの活動状況、開発ツールの詳細について解説する。
発表資料      doi:10.18908/togo2017.p026
番 号 27
タイトル 天然変性タンパク質データベースIDEAL
発表者 ○太田元規1)、嘉戸裕美子1)、坂本盛宇2)、細田和男3)、小池亮太郎1)、廣明秀一4)、福地佐斗志3)
所 属 1) 名古屋大学 大学院情報学研究科 2) (株)ホロニクス 3) 前橋工科大学 工学部
4) 名古屋大学 大学院創薬科学研究科
要 旨  タンパク質の配列のうち、立体構造を形成しない部分を天然変性領域といい、天然変性領域を有するタンパク質を天然変性タンパク質という。天然変性タンパク質は、シグナル伝達・転写調節といった重要な生命活動に関与しているため、近年注目を集めている。我々は天然変性タンパク質データベースIDEAL(http://www.ideal.force.cs.is.nagoya-u.ac.jp/IDEAL/)を開発、運営している。天然変性領域の実験的証拠は、 PDB 立体構造のミッシング領域やNMR、CD といった手法により得られる。IDEAL では、機械的に得られるミッシング領域に加え、機械的に収集する事が難しいNMR,CD により確認された天然変性領域の情報を論文査読により収集している。また、IDEALでは天然変性領域中の機能部位をProSと呼び、特別に注釈付けを行っている。IDEAL には2017年6月現在、838配列、8,502天然変性領域、555Pros が収録されており、天然変性タンパク質のデータベースとして世界一の規模に成長した。
発表資料      doi:10.18908/togo2017.p027
番 号 28
タイトル Het-PDB Navi2: タンパク質-低分子複合体構造から得られる相互作用部位のデータベース
発表者 ○塩生真史、郷通子
所 属 長浜バイオ大学 バイオサイエンス学部
要 旨  タンパク質の機能予測や創薬のために、低分子化合物とタンパク質との相互作用部位の情報は有用である。ProteinData Bank には約13万の生体高分子の立体構造情報が登録されており(2017年6月現在)、これらには23,000種近くの低分子化合物とタンパク質の複合体情報が含まれている。このようなタンパク質との相互作用部位が明らかになっている低分子化合物のデータベースとしてHet-PDB Navi.を公開してきた[1]。今回我々は、Het-PDB Navi.のユーザーインターフェースを大幅に機能アップし、低分子化合物の名前や同義名による検索を容易に行えるHet-PDB Navi2を公開した[2]。また、Het-PDB Navi2では、Het-PDB Navi. で検索できた情報に加えて、低分子化合物の立体構造の観察や、類似の構造を持つ低分子化合物の取得のほか、低分子化合物との複合体構造において相互作用部位に存在するアミノ酸残基情報の取得が可能となっている。また、単一の低分子化合物、もしくは、類似の構造を持つ低分子化合物も含めた低分子化合物のグループについて複合体構造が一定数得られる場合には、その低分子化合物(または低分子化合物グループ)との結合に使われや すいアミノ酸残基の情報についても取得可能である。この情報は、タンパク質の立体構造から低分子化合物の結合部位予測を行う基盤データとなる。本発表ではこれらの機能の詳細や今後の展望について報告する。

[1] A. Yamaguchi et al., J Biochem., 2004, 135:79-84
[2] http://hetpdbnavi.nagahama-i-bio.ac.jp/
発表資料      doi:10.18908/togo2017.p028
番 号 29
タイトル 超高機能構造タンパク質データベースの開発
発表者 ○荒川和晴1)、河野暢明1)、中村浩之2)、大利麟太郎2)、冨田勝1)、沼田圭司3)
所 属 1)慶應義塾大学 先端生命科学研究所 2)Spiber(株) 3)理化学研究所 環境資源科学研究センター
要 旨  クモ糸などの生体由来構造タンパク素材は、その強靭さや再生可能性などから、次世代の高機能素材として注目されている。我々は革新的研究開発推進プログラム(ImPACT・鈴木PM)の一部として、クモ糸を中心とした超高機能構造タンパク質の高機能発現メカニズムを明らかにするために、世界中からこれらの遺伝子を集め、また、タンパク自体の物性を詳細に解析し、データベース化を進めている。本プロジェクト終了時には、1,000種類を超えるクモ糸を始めとした構造タンパク配列と、250以上の構造タンパクの網羅的物性データをオープンに公開する予定である。本データベースは本質的に多様な生物群のサンプリングに関連した生態情報、核酸及びアミノ酸配列情報、そしてタンパクの物性情報など多岐に跨がる情報との連携が必須であり、そのためにResource Description Framework( RDF/XML)に基づくデータ出力も実装予定である。
発表資料      doi:10.18908/togo2017.p029
番 号 30
タイトル 糖鎖科学ポータルにおける化学構造を活用したデータベース連携
発表者 ○山田一作1)、木下聖子2)
所 属 1) 野口研究所 2)創価大学
要 旨  糖鎖研究の基盤となる糖鎖科学ポータルとして、GlyCosmos Portal の開発を実施している。本ポータルでは、糖鎖情報の標準として糖鎖構造表記法WURCS(PMID: 24897372, 28263066)やGlycoRDF オントロジー(PMID:25388145)を開発・活用し研究開発を進めている。本ポータルの主な要素はリポジトリとデータベースを計画している。リポジトリについては国際糖鎖構造リポジトリGlyTouCan(PMID: 26476458)の改良と複合糖質構造リポジトリであるGlyComb の新規開発を実施している。また、これら開発したリポジトリを活用し、糖鎖の分子構造、糖鎖遺伝子に関するパスウェイなどの情報を格納するGlyCosmos Database の開発を実施している。このデータベースにおける糖質の分子構造について、これまで実施してきた糖鎖構造を含むデータベースとの連携をもとに、複合糖質構造を各種データベースと連携することを目指し研究開発を実施している。
発表資料      doi:10.18908/togo2017.p030
番 号 31
タイトル 糖鎖構造解析を支援するためのGALAXYデータベース
発表者 〇矢木宏和1)、高橋禮子1)、加藤晃一1),2)
所 属 1) 名古屋市立大学 大学院薬学研究科 2) 自然科学研究機構 岡崎統合バイオサイエンスセンター
要 旨  糖鎖修飾は、主要な翻訳後修飾の一つである。糖鎖は分岐性、構造異性、構成残基の類似性から糖鎖の構造解析においては、DNA やタンパク質のような簡便なシーケンシング技術は存在しない。こうした状況下で、私たちは高速液体クロマトグラフィー(HPLC)を利用した糖タンパク質糖鎖の構造解析に着手し、これまでに600種類にのぼる糖鎖構造のHPLC の溶 出時間データを蓄積してきた。また、得られた糖鎖の溶出データをGALAXY データベース(http://www.glycoanalysis.info/galaxy2/)として公開することで、HPLC 溶出時間に基づいて糖鎖の構造解析を行うための基盤を整えることができている。本発表では、HPLC の溶出データに基づいた糖鎖構造の解析法を示すとともに、本糖鎖データベースの応用例について紹介したい。
発表資料      doi:10.18908/togo2017.p031
番 号 32
タイトル 国際糖鎖構造リポジトリと糖鎖関連データベースとの連携
発表者 ○新町大輔1)、青木ポール信行2)、渡辺由3)、奥田修二郎3)、山田一作4)、木下聖子1)
所 属 1) 創価大学 2)合同会社SPARQLite 3) 新潟大学 4)野口研究所
要 旨  GlyTouCan は糖鎖構造に対し、任意のアクセッション番号を割り当て、参照できる国際リポジトリである[PMID:26476458]。2014年から開発が開始されて以降、現在までに8万件を超える糖鎖構造(単糖・トポロジー・コンポジション等を含む)が登録されており、登録された糖鎖構造からは一意のWURCS [PMID: 24897372, 28263066] が生成され、アクセッション番号のユニーク性を担保している。また、GlyTouCan では外部データと統合した利用ができるようRDF ベースで開発されている。このため、BCSDB、GlycomeDB、GlycoEpitope、JCGGDB、UniCarbKB といった既にRDF 化されている国内外の糖鎖関連データベースとの連携が可能になった。加えて、糖鎖関連データベースの開発者と協力して、GlyTouCan パートナーという形で、糖鎖構造登録を進めることもできた。これにより、データベース名の組み合わせによる絞り込み検索が可能となり、各糖鎖関連データベースが持つデータが糖鎖構造を中心とした形に収束できるようになった。本ポスター発表では、GlyTouCanから糖鎖関連データへの連携の取組みについて紹介する。
発表資料      doi:10.18908/togo2017.p032
番 号 33
タイトル 糖タンパク質の機能解析に必須な糖鎖関連データベースのセマンティックウェブ化と国際化(ACGG-DB)
発表者 鹿内俊秀*1)、Elena Solovieva*2)、藤田典昭*1)、鈴木芳典*1)、高橋亜寿美1)、○安形清彦1),3)、梶裕之3)、成松久1),3)
所 属 1)グライコバイオマーカー・リーディング・イノベーション株式会社
2)科学技術振興機構 バイオサイエンスデータベースセンター 3)産業技術総合研究所 *旧所属:3)
要 旨  我々のグループでは、バイオサイエンスデータベースセンター(NBDC)の統合化推進プログラムに携わり、糖鎖関連データベース(DB)のセマンティックウェブ化と統合化を進めている。これまでに糖鎖関連遺伝子(GGDB)、レクチン(LfDB)、糖鎖と感染症(PACDB)や糖鎖疾患(GDGDB)に関連する情報からオントロジーを整備しデータをRDF 化した。また、IGOT 法や最近産総研で開発されたGlyco-RIDGE 法を用いてそれぞれ取得されたN 型糖鎖の付加位置および付加位置ごとのグライコフォームの情報を可視化できるグライコフォーム・ビューワーを開発し、糖タンパク質データベース(GlycoProtDB)に組み入れた。糖鎖関連DB 間のリンクを強化すると共に、海外のDB とのクロスリンクも進めている。検索方法には、ファセット検索と呼ばれる形式で、様々な項目をクリックするだけでエントリを絞り込めるようにした。本DBはAsian Community of Glycoscience and Glycotechnology(ACGG)-DB のサイトにて公開している。
発表資料      doi:10.18908/togo2017.p033
番 号 34
タイトル 糖鎖構造に対する自動アノテーションシステムの開発
発表者 ○奥田修二郎1)、金進東2)、渡辺由1)、新町大輔3)、青木ポール信行4)、山田一作5)、木下聖子3)
所 属 1) 新潟大学 2)情報・システム研究機構 ライフサイエンス統合データベースセンター 3)創価大学
4) 合同会社SPARQLite 5)野口研究所
要 旨  糖鎖構造のリポジトリとしてGlyTouCan が開発されている。多くの糖鎖研究者らによって見つけられたあらゆる糖鎖構造が網羅されており、現在では8万構造以上が登録されている。それぞれの糖鎖構造には、複数の構造フォーマットでの表現の他に、モチーフ構造の有無などの計算機で可能なアノテーションが付与されている。しかしながら、構造以外の情報として、例えば、その糖鎖構造を発現する生物種や組織などの文献ベースの情報については非常に限られている。これは文献情報を人が解釈する必要があるためで、専門的知識を持ったアノテーターが必要となるが、人手によるアノテーションには限界がある。そこで、糖鎖統合DB プロジェクトでは、DBCLS 金進東博士が開発するPubDictionaries およびPubAnnotation を利用し、テキストマイニングを元にした自動アノテーションの仕組みの開発に取り組んでいる。金博士の協力の下、糖鎖研究に関連する辞書の整備とそれを利用したテキストマイニングシステムであるGMAS(Glycan metadata annotation system)を開発している。
発表資料      doi:10.18908/togo2017.p034
番 号 35
タイトル がんのシグナル伝達ネットワークバリアントのデータベース
発表者 ○田辺麻央、金久實
所 属 京都大学 化学研究所
要 旨  Hanahan-Weinbergはがん細胞が獲得する特徴として当初は6つを、その後2つを追加して定義している。増殖シグナルの維持、増殖抑制の回避、細胞死の回避、無制限の複製による不死化、血管新生の誘導、浸潤と転移、エネルギー代謝のリプログラミング、免疫による破壊の回避といった特徴である。これらは分子的にはシグナル伝達ネットワークと深く関連しており、例えば一部の非小細胞肺癌患者に見られるEML4-ALK 融合遺伝子では、ALK キナーゼの恒常的活性化がMAPKシグナル伝達経路を通して増殖シグナルの維持、PI3K-AKT シグナル伝達経路を通して細胞死の回避をもたらしている。論文等に報告されたこのようながん関連の遺伝子バリアントやがんウイルスによるシグナル伝達ネットワークの変化をネットワークバリアントとして定義したデータベース化を行ったので、その解析例を含めて紹介する。なお本研究はKEGGNETWORKデータベース開発の一環として行われており、がんだけでなく様々な疾患に関与する遺伝子バリアントを含むネットワークバリアントを定義し、クリニカルシークエンスデータの解釈などに活用できるデータベースとして構築を行っている。
発表資料      doi:10.18908/togo2017.p035
番 号 36
タイトル 拡張代謝パスウェイデータベース「M-path」の構築
発表者 ○小川哲平1)、牧口大旭1)、荒木通啓2),3)
所 属 1)三井情報株式会社 2)京都大学 大学院医学研究科 3)神戸大学 大学院科学技術イノベーション研究科
要 旨  大腸菌や酵母などのモデル生物において有用物質を高効率で生産していくためには、これまでに蓄積された網羅的情報を利用し、実効性の高い合成経路を推定、設計していくことが必要となる。
 本研究では、公共データベースから既知の酵素反応データを収集し、そのデータを元にして化学・生物情報解析を行った。得られた解析の結果から未知の化合物・酵素反応を推定し、任意の化合物に対する合成経路の知識を拡張していくことを目標とし、拡張代謝パスウェイデータベース「M-path」を構築した。
 本データベースは、代謝パスウェイにおける有用化合物への適用として、アミノ酸およびケト酸のデータをPubChemデータベースより取得し、網羅的な代謝パスウェイの出力、データベース構築を実施した。
 得られた結果は、独自の化合物・パスウェイデータベース中に格納するとともに、これらの結果を統合したプラットフォームの構築も合わせて行った。

M. Araki, R. S. Cox III, H. Makiguchi, T. Ogawa,T. Taniguchi, K. Miyaoku, M. Nakatsui, K. Y. Hara and A. Kondo,Bioinformatics 2015, 31, 905-911.
発表資料      doi:10.18908/togo2017.p036
番 号 37
タイトル SSBD:国内連携、国際連携およびデータリポジトリ
発表者 ○遠里由佳子1),2)、ホー・ケネス1)、京田耕司1)、大浪修一1)
所 属 1)理化学研究所 生命システム研究センター 2)大阪電気通信大学 情報通信工学部
要 旨  近年の生命科学における生命動態の定量解析の重要性の高まり、およびイメージング技術の発展に対応するために、我々はこれまでに、生命動態情報と細胞・発生画像情報の統合データベースSSBD の開発を行ってきた。我が国の生命動態の定量解析に関する全てのデータを統合するために、我々はこれまでに、理研QBiC、JST CREST生命動態、文科省生命動態システム科学推進拠点事業と連携し、各プロジェクトで生産されたデータの統合を進めてきた。今年度は、細胞生物学および発生生物学分野の全データの統合を目指し、日本細胞生物学会、日本発生生物学会、ABiS および理研CDB との連携を開始した。また、データベースの国際連携を目指し、英国のOME プロジェクトと欧州のEuro-bioimaging プロジェクトとの連携を開始した。また、近年の学術論文の原データの公開義務化の動きに対応するため、データリポジトリの機能を追加した。本発表では、SSBDの今後の発展に重要なポイントとなるこれらの事案について最新の状況を報告する。
発表資料      doi:10.18908/togo2017.p037
番 号 38
タイトル BDML/BD5:生命現象の時空間動態に対する定量データの統合フォーマット
発表者 ○京田耕司1)、遠里由佳子1),2)、ホー・ケネス1)、大浪修一1)
所 属 1)理化学研究所 生命システム研究センター 2)大阪電気通信大学 情報通信工学部
要 旨  生細胞イメージングやモデリング技術の発展に伴い、生命現象の時空間動態に対する定量データが画像処理やシミュレーションを介して大量に産出されている。これらの定量データの再利用を促進するために、分子、細胞から個体レベルの生命現象の時空間動態を統一的に記述するための言語Biological Dynamics Markup Language(BDML)を開発した(Kyoda et al. Bioinformatics 31, 2015)。BDML はXMLを基盤としており、その高可読性はデータの共有や各種ツール群の開発を容易にし、高拡張性は新しいタイプのデータへの柔軟な対応を可能にする。今年度は、ビッグデータ時代への取り組みとして、定量データ本体をHDF5で記述できるBD5フォーマットを開発した。データ本体をバイナリで記述することにより、データアクセスの高速化やファイル容量の削減が期待される。さらにBD5に対応した解析ツールの開発も開始している。Python を使って開発し、Jupyter Notebook で公開することにより、解析プログラムおよび処理結果の共有を可能にする予定である。
発表資料      doi:10.18908/togo2017.p038
番 号 39
タイトル SSBD:生命現象の時空間動態に対する定量データと画像データの統合データベース
発表者 ○ホー・ケネス1)、京田耕司1)、遠里由佳子1),2)、大浪修一1)
所 属 1) 理化学研究所 生命システム研究センター 2) 大阪電気通信大学 情報通信工学部
要 旨  統合データベースSSBD(Systems Science of Biological Dynamics database; http://ssbd.qbic.riken.jp)では、生細胞イメージングやモデリング技術により得られる多様な生命現象の時空間動態に対する定量データや画像データを格納・共有している(Tohsato et al. Bioinformatics 32, 2016)。定量データは BDMLで統一的に記述される。本年度は、データの大容量化に対応し高速なデータアクセスを実現するため、HDF5を基盤とする新しいデータ形式BD5で定量データ本体を記述し、これらのデータベースへの格納を完了した。我が国の細胞生物学および発生生物学分野で得られる画像データの定量化を促進するために、定量化が求められる20セット以上の新規画像データの格納を開始している。さらに、データベースシステムをDocker に移行することにより、システム開発の効率化を図った。SSBD で共有したデータはAPI を通してJupyter Notebookなどで読むことができ、今後のデータ再利用の促進が期待される。
発表資料      doi:10.18908/togo2017.p039
番 号 40
タイトル Integbioデータベースカタログの拡張
発表者 ○信定知江1)、建石由佳1)、坂東明日佳1)、加藤健弘2)、大久保克彦2)、井上圭介3)、宮崎敦子1)、酒井智子1)、畠中秀樹1
所 属 1) 科学技術振興機構 バイオサイエンスデータベースセンター 2) 株式会社日立製作所 3)株式会社日立公共システム
要 旨  「Integbio データベースカタログ(https://integbio.jp/dbcatalog)」は文部科学省・厚生労働省・経済産業省・農林水産省の連携のもと、主に国内で作成された生命科学系データベース(DB)の所在とその概要を提供することを目的として始まったサービスである。現在1600件を超える国内外の生命科学系DB 情報を収録している。さらに2016年秋よりFAIRsharing.org (https://fairsharing.org) と連携を開始し、日本国内で作成されたDB の情報を広く海外へ発信すると共に国外DB情報を効率的に収集するための基盤作りを進めている。2017年3月には、カタログから提供するDB 情報項目の追加・改修を行った。主な点としては、海外からの利用も視野に入れ、英語サイトに「DB description」の項目を追加した。また、ユーザが興味のあるDB をより探しやすくするための仕組みとして、各DBに付与した「説明」のテキストと「タグ」情報をベースとしてDB 間の類似度を算出し、各DBの「類似データベース」として提供を開始した。当日は今後のカタログの在り方についても議論したい。
発表資料      doi:10.18908/togo2017.p040
番 号 41
タイトル 経済産業省関連ライフサイエンス・ポータルサイト MEDALS
発表者 雨宮崇之、福西快文、堀本勝久、○福井一彦
所 属 産業技術総合研究所 創薬分子プロファイリング研究センター
要 旨  経済産業省の研究機関である産業技術総合研究所では、省庁間での生命科学系データベースの統合に向けてポータルサイトであるMEDALSの運用を行っている。主たる連携事業として、便覧のアップデート、横断検索へのデータ付加、DBのアーカイブ化を行いNBDCに提供し公開している。これまでMEDALSでは、解析ツールに関するオントロジーや医薬品関連デー タ整備もNBDC と協力して実施している。また情報統合DB サイトなどで公開してきた解析ワークフローに関するサービスをMEDALS における連携活動に取り入れ、データベースとツールの連携に取り組んでいる。この解析ではデータベースのRDF 化に伴い、開発した高度な解析ツール群を広く利用可能とするために、セマンティック技術に対応したフレームワークを用い、オントロジーを利用したサービスを目指している。
発表資料      doi:10.18908/togo2017.p041
番 号 42
タイトル 臨床試験情報から探る難病創薬のトレンド
発表者 ○坂手龍一1)、深川明子1)、鈴木雅2)、松山晃文1)
所 属 1)医薬基盤・健康・栄養研究所 2)日本製薬工業協会 医薬産業政策研究所
要 旨  難病の多くは希少疾患であるが6,000以上の疾患があり、患者数はEU だけでも3,000万人に上る。その多くは発症機序が明らかでなく、治療法どころか診断基準が不確定であり、創薬の高いハードルとなっている。我々は疾患横断的な創薬トレンドを明らかにし、創薬ターゲット選定や発症機序解明を促進するため、臨床試験情報を解析した。まず、国内の指定難病306疾患(平成28年時点)を対象に、薬物などの情報から様々な適応拡大の動向を明らかにした[1- 3]。そして、疾患名などによる対応付けにより、国外希少疾患DB[4]との情報連結を実施した[5]。これらをDB 化し、実験動物・疫学研究・バイオバンクなどの情報[6,7]と合わせて活用を図っている。

[1]「 指定難病に対する臨床試験実施状況」政策研ニュースNo.48( H28.7)
[2]「 指定難病に対する臨床試験の実施者」同No.49( H28.11)
[3]「 指定難病の臨床試験に用いられる上市医薬」同No.50 (H29.3)
[4] Orphanet http://www.orpha.net
[5]「 指定難病情報のデータベースとの連結」同No.49( H28.11)
[6] メディカル・バイオリソース・データベース https://mbrdb.nibiohn.go.jp
[7] 創薬支援データベース統合検索 https://alldbs.nibiohn.go.jp
発表資料      doi:10.18908/togo2017.p042
番 号 43
タイトル 創薬・疾患研究のためのデータベース検索システム Sagace
発表者 ○樋口千洋1)、長尾知生子1)、五十嵐芳暢2)、森田瑞樹1),3)、陳怡安1)、深川明子4)、坂手龍一5)、水口賢司1)
所 属 1)医薬基盤・健康・栄養研究所 バイオインフォマティクスプロジェクト
2)同研究所 トキシコゲノミクス・インフォマティクスプロジェクト 3)岡山大学 大学院医歯薬学総合研究科
4)医薬基盤・健康・栄養研究所 政策・倫理研究室 5)同研究所 難病資源研究室
要 旨  医薬基盤・健康・栄養研究所では、JST バイオサイエンスデータベースセンターと連携し、データベース横断検索システムSagace(http://sagace.nibiohn.go.jp)を開発・公開している。Sagaceは、創薬・疾患に特化した約190のデータベースを選定・分類して検索対象とし、ファセット(データベースの分類)による検索結果の効率的な絞り込みと、メタデータ(データに関する事項を記述したデータ)を反映した効果的な検索結果の表示を実装した検索システムで、一般的な横断検索システムよりも創薬・疾患研究に関する情報を効率的に発見できる。
 今年度は、昨年度に強化した臨床情報に加え、薬理、薬物動態、毒性などの非臨床情報についても検索機能を強化するために、各製薬会社が公開している医薬品の審査資料などを検索対象に加えることを進めている。さらに同義語展開機能の強化も行なうことで、より効率的に創薬・疾患研究を支援する検索システムの構築を目指している。
発表資料      doi:10.18908/togo2017.p043
番 号 44
タイトル 生命科学系研究データ循環基盤としてのアーカイブと横断検索
発表者 ○大波純一1)、八塚茂1)、杉崎太一朗2)、友田史緒里2)、牧口大旭2)、加藤健弘3)、井上圭介4)、大久保克彦3)
川本祥子5),6)、畠中秀樹1)
所 属 1)科学技術振興機構 バイオサイエンスデータベースセンター 2)三井情報株式会社 3)株式会社日立製作所
4)株式会社日立公共システム 5)情報・システム研究機構 ライフサイエンス統合データベースセンター
6)情報・システム研究機構 国立遺伝学研究所
要 旨  近年のオープンサイエンス推進の潮流や情報通信技術の発展に伴い、生命科学系研究データの規模は増加の一途を辿っている。バイオサイエンスデータベースセンター(NBDC)は、この流れの中で、生命科学データベース横断検索と生命科学系データベースアーカイブ、及びIntegbio データベースカタログを公開し、データの利用者だけでなく開発者の課題に応える活動を行っている。横断検索では今年、ダンプデータ横断検索機構の開発と、検索クエリログの分析に基づく検索結果スコアリングアルゴリズムの改定を実施し、検索対象の拡大と検索結果の適正化を達成した。アーカイブでは寄託件数が130件を突破し、Scientific Dataの推奨レポジトリに認められ、コミュニティにおける基盤の1つとして認知されつつある。
 国際社会では研究データの適切な循環のため、FAIR 原則(Findable、Accessible、Interoperable、Reusable)に従うことが標準となりつつある。横断検索とアーカイブでこの条件をサポートし、日本の生命科学界の研究データ循環のメインパイプとなるよう、引き続き改善と品質向上に努めていく。
発表資料      doi:10.18908/togo2017.p044
番 号 45
タイトル TogoVar(日本版変異統合DB)の開発
発表者 ○三橋信孝1)、片山俊明2)、川嶋実苗1)、川島秀一2)、宮崎和典1)、河野信1),2)、建石由佳1)、藤原豊史2)
所 属 1)科学技術振興機構 バイオサイエンスデータベースセンター
2)情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  我々は本年度よりヒト変異情報の統合データベース『TogoVar』の開発を開始した。TogoVar の大きな目的は2つある。1つ目は、NBDC とDDBJ が共同運用しているヒト試料由来の様々なデータを共有するためのプラットフォーム『NBDCヒトデータベース(NBDC ヒトDB)』の登録データの利用を促進することであり、もう1つは、世の中に多数存在する知識DBを統合し、わかりやすく提示することである。
 疾患関連研究において検出力を左右する要因の一つに対象数があるが、単独の研究室で収集できる対象数には限度がある。NBDCヒトDBには、2017年7月時点で延べ2万人程度の日本人配列データが蓄積されている。それらのデータを自らの研 究に活用可能か利用者自身に判断していただくため、TogoVarでは、サブミッション単位に格納されているデータを様々なレベルで統合し、より多くの検体から構成される集団の集計情報を公開することで、格納されているデータの概要を示していく。
 また、疾患との関連が示された変異を解釈するためのDB 群や文献情報を統合し、ユーザにわかりやすく提示するインターフェースを作成する。そのために統合DB プロジェクトで培ったRDF 技術やテキストマイニング技術、各種TogoStanzaを最大限活用する。まずはNBDC ヒトDB に登録されている統合可能な全データからなる日本人集団の参照情報を2017年度中に公開予定である。
発表資料      doi:10.18908/togo2017.p045
番 号 46
タイトル がん関連疾患遺伝子/タンパク質相互作用データベースCancerProView
発表者 ○満山進
所 属 慶應義塾大学 医学部
要 旨  がん関連遺伝子とその周辺に関する遺伝子と疾患の解明のため、がん関連遺伝子/タンパク質の相互作用データベースシステムCancerProView の開発を行っている[Mitsuyama S and Shimizu N, Genomics.100:81(2012)]。CancerProView は、Internet Explorer、Firefox、Google Chrom などのWeb ブラウザで検索できるように作成されて おり、2006年よりインターネット上(http://cancerproview.dmb.med.keio.ac.jp/)で公開されている。機能としては、1:がん関連遺伝子とタンパク質のパスウェイ、ドメインと関与する疾患のグラフィカル表示、2: 多型を含む遺伝子変異のグラフィカル表示、3: 画像表示からのOMIM, Pubmedへのリンク、4:共通なドメイン構造をもつタンパク質の検索、5: 遺伝子記号からの検索、6: タンパク質ドメイン名一覧からの検索、7: がん関連疾患一覧と遺伝子の対応表からの検索などが実装されている。これらの機能によりCancerProViewは、がんの診断、治療、予防の分野に貢献すると考えられる。
発表資料      doi:10.18908/togo2017.p046
番 号 47
タイトル SNVから疾患を予測するツールiMSVMの開発
発表者 ○武田淳一、七枝健太朗、山岸諒大、大野欽司
所 属 名古屋大学 大学院医学系研究科
要 旨  一塩基多型(SNV)によるアミノ酸のミスセンス変異から疾患を予測するツールはいくつか存在するが(VEST3やFATHMM など)、これらは評価指標が異なるため結果に統一性がない。そこで我々は、機械学習の1つであるサポートベクターマシン(SVM)を用いて既存ツールの評価指標を統合し、アミノ酸置換ごとに疾患か正常かを網羅的に判別するツールiMSVM を開発した。疾患を引き起こすミスセンスSNV はHuman Gene Mutation Database(HGMD)から抽出し、正常SNV はdbSNP からマイナーアレル頻度(MAF)の高いものを抽出した。これら2種類のSNV グループに対してANNOVAR を用いてアノテーションし、dbNSFP v3.0a の23ツールの疾患予測結果を特徴量として、LIBSVM を用いてSVM による判別を行った。150種類のアミノ酸置換モデルから得られた感度と特異度によるROC 曲線下面積(AUC)が既存ツールより上回っていたため、iMSVMは精度の高い疾患予測を行うことができた。
発表資料      doi:10.18908/togo2017.p047
番 号 48
タイトル Mutation@A Glance: ヒト遺伝子バリアント統合可視化ツール
発表者 ○土方敦司、白井剛
所 属 長浜バイオ大学 バイオサイエンス学部
要 旨  高速シークエンサーの普及により、これまで不明とされてきた遺伝子疾患の原因変異の特定が容易になりつつある。それに伴い、影響が不明なバリアント(VUS)も多数見つかるようになってきており、遺伝子上の変異と表現型とがどのように関係しているかを分子レベルで理解することが大きな課題となっている。この目的のためには、塩基配列だけでなく、その遺伝子がコードするタンパク質の構造及び機能情報の活用が大いに役立つ。我々は、ヒト遺伝子バリアントの情報を、ゲノムからタンパク質立体構造複合体までを一気通貫で可視化するツールMutation@A Glance を開発した。このツールは、現在公開されている種々のヒトバリアントデータベース(dbSNP, ClinVar, OMIM, COSMIC, ExAC, JGVDなど)のデータを統合し、ゲノム配列、アミノ酸配列及びタンパク質立体構造上で可視化する。ユーザーが自身の興味のある遺伝子変異について、タンパク質の機能あるいは構造へ与える影響について解析することができる。本発表では、このツールを活用した遺伝子疾患変異の機能解析について事例を交えて紹介する。

URL: http://harrier.nagahama-i-bio.ac.jp/mutation/
発表資料      doi:10.18908/togo2017.p048
番 号 49
タイトル 公共オミックスデータ検索とそれを活用したデータ解析支援
発表者 ○坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  DBCLSは国際塩基配列データベースを運営しているDNA Data Bank of Japan(DDBJ)と連携し公共オミックスデータのレポジトリ DDBJ Omics aRchive(DOR)の構築にも関わっている。これまで長年にわたって維持管理してきた遺伝子発現目次(http://aoe.dbcls.jp/)を発展させてDOR の検索システムにも使えるようにし、各自のオミックス研究に大量塩基配列データを活用できるように検索ツール開発を行っている。ただツールを作成しただけでは使われにくいため、構築した検索システムをフル活用した研究支援にも取り組んでいる。以下の参考論文で活用された疾患モデルにおけるオミックスデータ解析実例に関して報告する。

[1] Okamoto A et al. Scientific Reports 7:3816 (2017) doi:10.1038/s41598-017-03980-7
[2] Kikuchi A et al. BMC Genomics 18:83 (2017) doi:10.1186/s12864-016-3455-y
発表資料      doi:10.18908/togo2017.p049
番 号 50
タイトル jMorp: 日本人多層オミックス参照パネル
発表者 ○田高周1)、小柴生造1),2)、三枝大輔1),2)、加藤恭丈1)、井上仁1)、元池育子1),3)、城田松之1),2),3)
青木裕一1),3)、木下賢吾1),3)、山本雅之1),2)
所 属 1)東北メディカル・メガバンク機構 2)東北大学 大学院医学系研究科 3)東北大学 大学院情報科学研究科
要 旨  血液中の代謝物やタンパク質の中には、種類や濃度が個人間で異なるものや、また、個人内においても加齢や疾患の有無で濃度が変化するようなものがある。そのような血液中の化合物は疾患バイオマーカーと呼ばれることがあり、疾患予防や早期診断を行う際に有用な情報源になり得る。
 東北メディカル・メガバンク機構(ToMMo)では東北メディカル・メガバンク事業における地域住民コホート調査に参加いただいた日本人1008人(男性433人、女性575人)の血漿サンプルの統合解析を行い、日本人集団における血漿中の代謝物の濃度分布やタンパク質の頻度分布を明らかにした。この解析結果はjMorp(Japanese Multi Omics Reference Panel; https://jmorp.megabank.tohoku.ac.jp)にて公開している。
 2017年6月現在では、NMR で同定された37化合物の濃度分布、LC-MS で検出された257代謝物のピーク強度分布、加えて256タンパク質(男性190人, 女性311人)の測定頻度を公開している。
 今後、解析サンプル数の増加や同定物質の種類を増加することでパネルの精度向上を目指し、また、ゲノム情報等との関連解析を行うことでデータベースコンテンツの拡充を図る。
発表資料      doi:10.18908/togo2017.p050
番 号 51
タイトル 多層的疾患オミックス解析のための統合データベース ”iDOx DB”
発表者 ○田中啓太1)、中川寛之1)、友田史緒里1)、高橋順子1)、金井弥栄2)、松本健治3)、南野直人4)、斎藤嘉朗5)
吉田輝彦6)
所 属 1)三井情報株式会社 2)慶應義塾大学 医学部 3)国立成育医療研究センター 4)国立循環器病研究センター
5)国立医薬品食品衛生研究所 6)国立がん研究センター 研究所
要 旨  Integrative Disease Omics Database(iDOx DB)は、独立行政法人医薬基盤研究所(現、医薬基盤・健康・栄養研究所)による先駆的医薬品・医療機器研究発掘支援事業の平成22年度(2010年度)採択プロジェクトの一つである「多層的オミックス解析による創薬標的の網羅的探索を目指した研究」において構築され、2015年3月31日に公開されました。
 多層的オミックス解析は、6つの国立高度専門医療研究センターを中心とする研究体制で
① 創薬標的や診断マーカーとなる新規性の高い分子や分子経路を発見すること
②データベースを構築・公開し、大学・企業などで実施する装薬研究に役立てること
を目標として実施されました。
 本データベースは、てんかん、肺がん、腎がん、乳がん、胃がん、肥満症、非アルコール性脂肪性肝炎、拡張型心筋症、大動脈瘤、アレルギー性疾患、小児白血病、アルツハイマー病、脊柱管狭窄症の13疾患を対象に、臨床情報とゲノム・エピゲノム・トランスクリプトーム・プロテオーム・メタボロームの各オミックス解析から得られた実験値データを閲覧でき、実験値を染色体上やパスウェイ上にマッピングして比較可能なビューアを搭載しています。
 ここでは、2017年3月末にリニューアルされたiDOx DBを紹介いたします。
発表資料      doi:10.18908/togo2017.p051
番 号 52
タイトル 疾患ヒトゲノム変異の生物学的機能注釈を目指した多階層オーミクスデータの統合
発表者 ○鈴木穣、菅野純夫
所 属 東京大学 大学院新領域創成科学研究科
要 旨  我々のグループでは、DBKERO(Kashiwa Encyclopedia of Regulatory Omics Database)を開発し、ヒトのマルチオミクスデータの統合を試みている。本データベースは、特に、疾患に関連したヒトゲノム多型・変異に生物学的機能注釈を与えることを目的に、様々な目的で産出された、ゲノム変異位置、近傍におけるエピゲノム(ヒストン修飾、DNAメチル化パター ン)、トランスクリプトーム情報(発現量、スプライスパターン)をヒトゲノム情報に統合している。データの統合は、現在、がんゲノム解析を志向したものを中心に行っているが、最終的には疾患の別を超えたデータの統合を目指す。現在は、ヒト培養細胞系あるいはマウスをはじめとする動物モデル系から得られたオミクスデータを中心にデータベースに収載している。
 今期、DBKERO では、ヒトゲノムバリエーションデータベースとの融合を行っている。これによりHLA 領域多型データを含めて、格納されるヒトゲノム多型情報は格段に拡大する。多層オーミクスデータについては、今期、日本側のCREST が終了するIHEC(国際エピゲノムコンソシアム)データの本邦での受け皿となる。独自性の高い疾患多層オーミクス情報統合デー タベースの構築を目指すものである。
発表資料      doi:10.18908/togo2017.p052
番 号 53
タイトル dbHERV-REs:ヒト内在性レトロウイルス由来転写調節エレメントデータベースの構築
発表者 伊東潤平1),2)、○杉本竜太2)、中岡博史2)、山田思郎3)、木村哲晃2)、早野崇英4)、井ノ上逸朗1),2)
所 属 1)総合研究大学院大学 生命科学研究科 2)情報・システム研究機構 国立遺伝学研究所
3)東海大学 医学部付属大磯病院 4)山口大学 大学院医学系研究科
要 旨  トランスポゾンの一種であるヒト内在性レトロウイルス(HERV)は、配列中に転写調節エレメントを有しており、挿入部位近傍の遺伝子発現調節に様々な影響を与える。我々は公的データベースに蓄積したChip-Seqのデータを再解析することで、こうしたHERV由来転写調節エレメント(HERV-RE)を網羅的に同定した。また、これらHERV-REを搭載したデータベースdbHERV-REs(http://herv-tfbs.com)を開発した。本データベースは、1)HERV の系統的分類、コピー数、挿入年代等の基礎情報、2)HERV-REのヒトゲノム上およびHERVコンセンサス配列上における位置情報、および3)HERV-RE近傍の遺伝子群を用いて行ったGene Ontologyエンリッチメント解析の結果を提供する。本データベースにより、遺伝子転写調節におけるHERV-REの役割を解明するための研究基盤を提供したい。
発表資料      doi:10.18908/togo2017.p053
番 号 54
タイトル GA4GH Genomics API によるマルチオミクスデータ統合検索
発表者 ○河野信1)、鈴木穣2)、菅野純夫2)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター 2)東京大学 大学院新領域創成科学研究科
要 旨  近年、希少疾患や癌の診断においてゲノム情報が利用されるようになってきた。これらを研究や治験、効率的な治療に応用するためには、データを共有することが重要である。ゲノム情報を国際的に共有するための仕組みとしてGlobal Alliance for Genomics and Health(GA4GH)ではGenomicsAPI を提供している。GenomicsAPI では変異の情報を共有することに主眼をおいているが、変異だけでなくエピゲノムや遺伝子発現(以下、マルチオミクス)の情報も統合的に共有できれば、より粒度の細かいデータを研究・診断・治療に利用できる。そこで、ここではGenomicsAPI のデータモデルを拡張し、マルチオミクスデータに対応させた。サンプルデータとしてKERO データベース(http://kero.hgc.jp/)に収録されている肺腺がん由来26細胞から得られたマルチオミクスデータを利用し、これらをVCF 形式に変換してGenomicsAPI リポジトリに登録した。この結果、変異を含むマルチオミクスデータのGA4GH GenomicsAPI を利用した統合検索が可能となった。
発表資料      doi:10.18908/togo2017.p054
番 号 55
タイトル 寄託データを対象とした秘匿検索の試験的実装
発表者 ○河野信
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  既に個人のゲノム配列を読むことは、技術的にもコスト的にも容易になった。このような個人のゲノム情報を共有することは医療の発展に不可欠であるが、一方でプライバシーの問題があり、データをそのまま共有することはできない。そこで、実際のデータは隠したまま検索が可能な秘匿検索を利用する必要がある。これまでデータ提供者と利用者が同じで外部のクラウドサービスを利用する場合や、データ提供者とデータ利用者の2者間で直接検索を行う場合の秘匿検索については既にいくつかの実装がなされている。しかしながら、今後このような機微データを第三者機関(例えばNBDC)に寄託して検索システムを提供することも考えられる。そこでここでは、1) データ寄託者、2) 検索システム提供者、3) データ利用者の3者を想定し、それぞれがデータや検索クエリを秘匿しながら、ゲノム情報を検索可能な秘匿検索のプロトタイプを作成した。具体的には、データ寄託者は暗号化されたデータを検索システム提供者に寄託し、データ検索の際にデータ利用者は難読化したクエリを検索システム提供者に送付して、3者それぞれがデータやクエリの中身を知ることなしに、データを共有可能なシステムを開発した。
発表資料      doi:10.18908/togo2017.p055
番 号 56
タイトル 各種レポジトリに登録されたメタデータを収集したOmicsDIのRDF化
発表者 ◯河野信1)、Yasset Perez Riverol2)、Tobias Ternent2)、守屋勇樹1)、Eric Deutsch3)、Michel Dumontier4)
Juan Antonio Vizcaino2)、Henning Hermjakob2)、五斗進1)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター
2)European Molecular Biology Laboratory, European Bioinformatics Institute (EMBL-EBI), Hinxton, Cambridge, United Kingdom
3)Institute for Systems Biology (ISB), Seattle, USA
4)Institute of Data Science, Maastricht University, Maastricht, Netherlands
要 旨  Omics Discovery Index (OmicsDI, http://www.omicsdi.org/) は、各種オミクスデータリポジトリ(ゲノム:Ensembl, EGA、トランスクリプトーム:ArrayExpress, ExpressionAtlas、プロテオーム:GPMDB, MassIVE, PeptideAtlas, PRIDE、メタボローム:GNPS, MetaboLights, MetabolomeExpress, Metabolomics Workbench)に収録されているデータセットのメタデータを提供している。ここではOmicsDIのメタデータならびにデータセットに含まれるリンク(遺伝子やタンパク質エントリなど)をRDF化し、統合検索システムを構築した。2016年10月時点で約8万件のデータセットが登録されており、これらをRDFに変換し、トリプルストアに格納した。この結果、各種オミクスデータセットを横断的に検索可能になっただけではなく、これらのデータセットと紐付いているUniProtエントリやPubChemエントリ、PubMed文献などからもマルチオミクスのデータセットが検索可能となった。
発表資料      doi:10.18908/togo2017.p056
番 号 57
タイトル jPOST:プロテオーム統合データベースプロジェクト
発表者 ○奥田修二郎1)、渡辺由1)、守屋勇樹2)、河野信2)、山本格3)、松本雅記4)、高見知代4)、小林大樹5)、荒木令江5)
吉沢明康6)、田畑剛6)、杉山直幸6)、田中聡7)、五斗進2)、石濱泰6)
所 属 1) 新潟大学 大学院医歯学総合研究科
2) 情報・システム研究機構 ライフサイエンス統合データベースセンター
3) 新潟大学 生体液バイオマーカーセンター 4) 九州大学 生体防御医学研究所
5) 熊本大学 大学院生命科学研究部 6) 京都大学 大学院薬学研究科 7)Trans-IT
要 旨  異なる実験由来のプロテオームデータを統合し、統一された信頼基準で結果を解釈するために、jPOST(Japan ProteOme STandard Repository/Database, http://jpostdb.org/)では、質量分析装置から出力される生データを含む、プロテオームデータを投稿・蓄積するためのリポジトリ、生データを再解析するための標準化されたワークフロー、再解析後の高品質なプロテオームデータを蓄積・可視化するデータベースの3つを開発している。jPOST リポジトリは独自の高速アップロードシステムを開発し、昨年5月に一般公開、7月には国際標準のデータリポジトリシステムを提供するProteomeXchange コンソーシアムに正式加盟して、現在あらゆるプロテオームデータが蓄積されつつある。これらの生データから、より多くのプロテオーム情報を高精度に抽出する再解析ワークフローの開発も進行中である。データベース部分は、他の生命科学データベースとの相互利用を考慮しRDFを元に設計されており、ユーザーからのリクエストに対して様々な切り口で解析が出来るようなシステムとして開発されている。
発表資料      doi:10.18908/togo2017.p057
番 号 58
タイトル jPOST: メタデータのキュレーション
発表者 ◯小林大樹1)、荒木令江1)、奥田修二郎2)、渡辺由2)、守屋勇樹3)、河野信3)、山本格4)、松本雅記5)、高見知代5)
吉沢明康6)、田畑剛6)、杉山直幸6)、田中聡7)、五斗進3)、石濱泰6)
所 属 1) 熊本大学大学院生命科学研究部  2) 新潟大学 大学院医歯学総合研究科
3) 情報・システム研究機構 ライフサイエンス統合データベースセンター
4) 新潟大学 産学地域連携推進機構生体液バイオマーカーセンター 5) 九州大学 生体防御医学研究所
6) 京都大学 大学院薬学研究科 7)Trans-IT
要 旨  jPOST(Japan ProteOme STandard Repository/Database, http://jpostdb.org/)は、ヒト、および様々な生物種由来のプロテオームデータを統合し、統一された再解析プロトコルによって信頼性の高い結果を集積して、より精度の高いデータベースを構築することを目的としている。プロテオームデータは実験研究者からメタデータが付加された形でリポジトリへと登録され、データベースに利用される。リポジトリに蓄積されたデータを、データベースで利用していくには、生データがどのような実験手順を踏んで得られたものか正確にトレースし、メタデータとして情報を整理していくことが必要となる。我々は、ヒト臓器、疾患、モデル生物サンプル、およびタンパク質定量、翻訳後修飾などのプロテオーム解析にて導き出されるデータに焦点を当て、ユーザーからのサンプルおよび解析手法に関するメタデータをキュレーション(精査、および修正)し、データベースに有益な情報としている。また、メタデータの用語を正確に統制することで、ユーザー側の視点で整備された情報の提供を目指している。本発表では、実際のキュレーション方式と状況について報告する。
発表資料      doi:10.18908/togo2017.p058
番 号 59
タイトル jPOST:再解析プロトコルによる同定結果の質的向上
発表者 ○吉沢明康1)、田畑剛1)、守屋勇樹2)、河野信2)、奥田修二郎3)、渡辺由3)、山本格4)、松本雅記5)、高見知代5)
小林大樹6)、荒木令江6)、杉山直幸1)、田中聡7)、五斗進2)、石濱泰1)
所 属 1) 京都大学 大学院薬学研究科 2)情報・システム研究機構 ライフサイエンス統合データベースセンター
3) 新潟大学 大学院医歯学総合研究科 4) 新潟大学 生体液バイオマーカーセンター 5) 九州大学 生体防御医学研究所
6) 熊本大学 大学院生命科学研究部 7)Trans-IT
要 旨  プロテオーム統合データベース『jPOST』計画(Japan ProteOme STandard Repository/Database, http://jpostdb.org/)では、タンパク質同定結果リストではなく、生データであるマススペクトルデータをjPOST リポジトリから収集し、独自に再解析して、その結果をデータベースに収録する。そのためには、false negative 及びfalse positiveの両者を最大限抑制することが必要である。前者に対しては、「ピーク検出」と「データベース検索」の両方の段階で複数のアルゴリズムを併用する戦略を採用し、単一アルゴリズムに基づく場合と比べてタンパク質同定数を増加させることに成功した。次にfalse positive 低減のための手法として、サーチエンジンに依存しないマススペクトル解釈結果のスコア化を行った。本手法をtarget-decoy 法によって検証した結果、通常の検索結果に比べてアサイン結果が1割以上増加することが確認できた。本発表では、スコア化の効果と、データベース構築に利用するための改良について報告する。
発表資料      doi:10.18908/togo2017.p059
番 号 60
タイトル jPOST データベースの開発
発表者 ○守屋勇樹1)、河野信1)、奥田修二郎2)、渡辺由2)、山本格3)、松本雅記4)、高見知代4)、小林大樹5)、荒木令江5)
吉沢明康6)、田畑剛6)、杉山直幸6)、田中聡7)、五斗進1)、石濱泰6)
所 属 1) 情報・システム研究機構 ライフサイエンス統合データベースセンター 2) 新潟大学 大学院医歯学総合研究科
3) 新潟大学 生体液バイオマーカーセンター 4) 九州大学 生体防御医学研究所 5) 熊本大学 大学院生命科学研究部
6) 京都大学 大学院薬学研究科 7)Trans-IT
要 旨  jPOST(Japan ProteOme STandard Repository/Database)プロジェクトは、様々なプロテオームデータを、統一した信頼基準を用いて生データから解析し直すことで、より精度の高い統合データベースを構築することを目的としている。これまでのプロテオームデータベースではヒトに焦点を当てたものが多かったが、jPOST では他の脊椎動物を始め、植物やバクテリアなどの多くの生物種にも対応し、リン酸化部位を始めとした様々な翻訳後修飾情報や、SRM 法を用いた絶対定量データを含む多くの定量情報を収録し、柔軟な検索インターフェースも提供する。また、国際プロジェクトであるC-HPP(Chromosome-centric Human Proteome Project)では、未だタンパク質レベルでの同定に至っていないヒトのMissing Protein を検出し、ヒトタンパク質の完全なリストを作成することを目的としている。そこで、既にRDF 化の進んでいるヒトタンパク質データベースneXtProtとjPOSTを繋げることで、多くのMissing Proteinを容易に同定することを可能とした。
発表資料      doi:10.18908/togo2017.p060
番 号 61
タイトル jPOST: タンパク質発現絶対量sliceの開発
発表者 ○松本雅記1)、高見知代1)、守屋勇樹2)、河野信2)、奥田修二郎3)、渡辺由3)、山本格4)、小林大樹5)、荒木令江5)
吉沢明康6)、田畑剛6)、杉山直幸6)、田中聡7)、五斗進2)、石濱泰6)
所 属 1) 九州大学生体防御医学研究所 2)情報・システム研究機構 ライフサイエンス統合データベースセンター
3) 新潟大学 大学院医歯学総合研究科 4) 新潟大学 生体液バイオマーカーセンター 5) 熊本大学 大学院生命科学研究部
6) 京都大学 大学院薬学研究科 7)Trans-IT
要 旨  jPOST(Japan ProteOme STandard Repository/Database, http://jpostdb.org/)では質量分析計で取得したプロテオームデータを集約して、様々な切り口でデータを可視化(=slice を作成する)することを目指している。近年、multiple reaction monitoring(MRM)/selected reaction monitoring(SRM)を用いたターゲットプロテオミクスによって個々のタンパク質の絶対量(細胞内コピー数や濃度など)の算出が可能になっている。また、従来から実施されてきたdata-dependent acquisition(DDA)による網羅的・半定量的なプロテオームデータであっても、タンパク質の発現量を擬似的に絶対値として示すことも可能になってきる。しかしながら、タンパク質の発現絶対量を算出するためには、分析に使用したタンパク質量や内部標準の濃度、細胞あたりのタンパク質量など新たなメタデータの登録フォーマット作成と質量分析の手法や目的に応じた絶対量算出ワークフローの確立などの開発が必須である。今回、主に内部標準を用いたMRM法で得られたデータ登録と絶対量算出のためのワークフローを確立した。さらに、jPOST データベースカスタム化ツールを用いて、パスウェイ構造の定量的可視化を行い、jPOSTsliceデータベースとして登録したので報告する。
発表資料      doi:10.18908/togo2017.p061
番 号 62
タイトル ダイズプロテオームデータベース:
電気泳動を基盤にした手法と質量分析計を基盤にした手法から得られたタンパク質データの統合
発表者 ○坂田克己1)、大柳一2)、杉本和彦3)、小松節子4)
所 属 1)前橋工科大学 2)King Abdullah University of Science and Technology 3)次世代作物開発研究センター
4)筑波大学
要 旨  ダイズは、消費量が穀類に次いで4番目であり、油糧用・バイオ燃料用としても重要な作物である。本研究では、機能解明研究に広く利用可能なダイズプロテオームデータベースを構築・公開し、ダイズ遺伝子発現の包括的な研究の促進に資する。本データベースは、2008年に公開されその後改良を重ねてきた[1,2]。このたび、電気泳動を基盤にしたプロテオミクスと 質量分析計を基盤にしたプロテオミクス解析技術を用いて得られたダイズタンパク質データを統合したので報告する[3]。ダイズのさまざまな生育時期の各種器官と細胞内小器官から得られたタンパク質データを格納している。さらに、ダイズはストレスに弱い作物であることより、各種ストレス下で変動するタンパク質群のデータを公開することにより、ストレス応答機構解明および対策研究の促進のための基盤情報を提供する。
 本データベースはhttp://proteome.dc.affrc.go.jp/Soybean/より公開している。

[1] Sakata et al., J Proteome Res, 2009, 8:4766-4778.
[2] Ohyanagi et al., Front Plant Sci, 2012, 3:110.
[3] Komatsu et al., J Proteomics, 2017, on line.
発表資料      doi:10.18908/togo2017.p062
番 号 63
タイトル 遺伝子発現リファレンスデータセット RefEx
発表者 ○小野浩雅、坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  RefEx(Reference Expression dataset; http://refex.dbcls.jp/ )は、4つの異なる実験手法(EST、GeneChip、CAGE、RNA-seq)によって得られた40種類の正常組織における遺伝子発現量を並列に表現することで、手法間の比較とともに各遺伝子の発現量を直感的に比較することが可能なリファレンスデータセットである。RefEx は、種々のID や遺伝子名、キーワードで検索できるのはもちろんのこと、任意のID セットについても複数同時に指定して検索することができ、ある特定の検索結果を指定して得ることが容易である。また、検索結果一覧からユーザが任意で選択した遺伝子について「リスト」に追加・保持する機能を利用することで、それらの詳細情報について一画面で並列に比較することが可能である。現在、FANTOM5 CAGEデータを始めとしたRDF化されている遺伝子発現データセットに対応する遺伝子発現データビューアの開発を進め、ウェブサイト全体のリニューアルを計画している。それらの進捗等をふまえ、開発の方向性について議論したい。
発表資料      doi:10.18908/togo2017.p063
番 号 64
タイトル The FANTOM web resource
発表者 ○野口修平1)、Marina Lizio1)、Imad Abugessaisa1)、Jessica Severin1)、粕川雄也1)、川路 英哉1),2),3)
所 属 1)理化学研究所 ライフサイエンス技術基盤研究センター 2)理化学研究所 予防医療・診断技術開発プログラム
3)理化学研究所 情報基盤センター
要 旨  哺乳類ゲノムの機能アノテーションを目的とした国際共同研究FANTOM(Functional ANnoTation Of Mammalian Genome)プロジェクトの第五回目であるFANTOM5では、ヒトやマウスなどの様々な初代培養細胞や臓器、細胞株、時系列サンプルより構成される約3000サンプルを対象に、転写開始の頻度を一塩基単位でゲノムワイドに測定した。本測定デー タを元に、ヒトゲノムの機能領域として重要な役割を果たすプロモーター、エンハンサー、そして非コードRNAのアトラス(地図)を作成した。これまでに知られていなかった機能領域を多数含むのみならず、各細胞における機能領域の活性情報が網羅的に付加されているこれらアトラスは、ゲノム科学に留まらず細胞生物学や臨床研究においても活用が期待される。得られたデータや解析結果については、オントロジーを用い体系的に整理されたサンプル情報と共に、データアーカイブそして複数のデータベースに格納され、多様な側面からの利用に供されている。本発表では、その全体像と共に個々のデータベースとその活用法を紹介する。
発表資料      doi:10.18908/togo2017.p064
番 号 65
タイトル 脳トランスクリプトームデータベースBrainTx ‐脳神経遺伝子発現情報の統合化‐
発表者 ○佐藤明1)、山口陽子2)、古市貞一1)
所 属 1) 東京理科大学 理工学部 2) 理化学研究所 脳科学総合研究センター
要 旨  Brain Transcriptome Database(BrainTx)(http://www.cdtdb.neuroinf.jp)は、哺乳動物の脳神経系の様々な局面(発達、老化、生理機能、行動、疾患など)の遺伝的基盤となるトランスクリプトーム情報とそれらと関連する神経科学情報を、可視化や解析可能な情報に体系化した脳神経遺伝子発現情報の統合的なデータベースである。今現在BrainTx には、ISH法による脳組織mRNA 分布画像(脳領域および細胞発現情報)、DNA マイクロアレイ解析による発達期脳の時系列発現情報や脳を含む臓器別発現情報(脳特異的発現情報)などの時空間的な遺伝子発現データが搭載されている。さらに我々は、脳詳細領域、生理条件、年齢、行動、疾患等を含む様々なステージや状態のトランスクリプトーム情報のビッグデータを収集し、神経科学の多分野情報と関連させてBrainTx に取り込み、検索可能な形式でデータベース化することを目指している。BrainTxで得られるこれらの多種多様な神経関連情報は、脳神経系やその多様な神経プロセスを支える多くの遺伝子やネットワークのメカニズムを理解するのに役立つと考えられる。
発表資料      doi:10.18908/togo2017.p065
番 号 66
タイトル 「SilkBase」カイコとその近縁種のトランスクリプトーム統合データベース
発表者 ○川本宗孝、勝間進、木内隆史、嶋田透
所 属 東京大学 大学院農学生命科学研究科
要 旨  SilkBase(http://silkbase.ab.a.u-tokyo.ac.jp)は、世界最高精度のカイコとその近縁種(クワコ・イチジクカサン・テンオビシロカサン・エリサン)のトランスクリプトーム統合データベースである。
 SilkBase には、トランスクリプトーム情報として、最新のゲノム情報から得られた予測遺伝子、RNA-seq のデータをde novo assemblyした配列、完全長cDNA等とそれらのアノテーション情報が登録されている。また、PIWI-interacting RNA (piRNA)経路を完全な形で保持しているカイコ卵巣由来の培養細胞BmN-4はpiRNA の研究材料として有用であるため、カイコ以外の研究者の利用を見込んで様々な組織や培養細胞由来のpiRNA 配列も登録されている。一方、ゲノム情報として、カイコ標準系統の最新のゲノムだけでなく、多系統のゲノムやクワコゲノム、Fosmid やBAC クローン配列等が登録されている。更に、エピゲノム情報として修飾ヒストンやヘテロクロマチンタンパク質に関するChIP-seq データが登録されている。SilkBase には高度な検索機能が付加されている上、膨大なデータがゲノムブラウザーで統合・可視化されており、多くの情報を一目で把握可能になっている。
発表資料      doi:10.18908/togo2017.p066
番 号 67
タイトル ヒトES細胞における網羅的な転写因子誘導株の樹立とその発現解析
発表者 ○中武悠樹1)、若林俊一1)、Martin Jakt1)、合田徳夫1)、細川淳一2)、伊藤紀子3)、西村邦裕4)、洪繁1)、的場亮3)、小原収2)、洪実1)
所 属 1) 慶應義塾大学 医学部 2)かずさDNA 研究所 3) 株式会社DNAチップ研究所
4) 株式会社テンクー
要 旨  網羅的な遺伝子摂動は、転写ネットワークを解析するうえで、大腸菌や酵母などで用いられてきた手法である。我々は、哺乳類ではあまり行われていない本アプローチにより、マウスembryonic stem(ES)細胞において網羅的に転写因子誘導をおこない、その解析を行ってきた。
 我々は、これまでのマウスでの解析を踏まえ、新たにヒトES 細胞での遺伝子誘導系を718遺伝子について構築し、そのうち506遺伝子について、誘導後のトランスクリプトームをデータベース化したので、本シンポジウムで報告する。本データベースは、遺伝子誘導後48時間のトランスクリプトームを、RNA-Seq(430遺伝子)およびマイクロアレイ(76遺伝子)により網羅的に解析しており、40遺伝子については同一サンプルをRNA - Seqとマイクロアレイ両方で解析した。この我々の構築したデータベースは、同一プラットフォームで遺伝子誘導後のダイナミックなトランスクリプトームを捉えており、摂動元が遺伝子誘導で明確であるため、ネットワーク構造を解析しやすい。また、ES 細胞なので様々な細胞系譜へと分化できることから、様々な角度で解析することが可能である。本シンポジウムでは構築したデータベースのみならず、構築中のバーコーディングシーケンスを用いた時系列データセットについても、広く議論したい。
発表資料      doi:10.18908/togo2017.p067
番 号 68
タイトル 植物ゲノム統合データベースPGDBjの構築
発表者 ○平川英樹1)、Jeffrey Fawcett1)、中谷明弘2)、市原寿子2)、柴谷多恵子1)、浅水恵理香3)、白澤沙知子1)
中村保一1)、磯部祥子1)、田畑哲之1)
所 属 1) かずさDNA 研究所 2) 大阪大学 大学院医学系研究科 3) 龍谷大学 農学部
要 旨  現在、モデル植物や実用作物など多種多様な植物種のゲノム配列が解読されている。散在するDB やDNA マーカーなど様々な植物ゲノム関連情報を有機的に統合した情報基盤を構築し、ユーザが必要とする情報を迅速に入手することができるポータルサイトPlant Genome DataBase Japan(PGDBj, http://pgdbj.jp)の開発を進めている。オルソログDB では、緑色植物40種とラン藻213種のオルソログ関係を定義し、植物リソースDB では、14生物種のcDNA やゲノム配列などのリソース情報を検索できる。DNA マーカーDB では、65植物種約26万件のDNA マーカー、45種約1万6千件のQTL情報を公開した。今期は、種、属、科など様々な階層間のゲノム関連情報を比較でき、特定の種で得られた知見を他の種で参照できる基盤を構築する。これまでに収集した情報に加え、ゲノムワイド多型情報をゲノムブラウザに集約させたゲノム横断的関連情報サイトの開発、遺伝子配列類似性に基づいたデータリンク基盤の構築、ユーザ自身がNGS データを投入し解析できるカスタム型多型・ハプロタイプ検出システムの構築を目指す。
発表資料      doi:10.18908/togo2017.p068
番 号 69
タイトル 種を超えたゲノム情報統合のためのデータリンク基盤の構築
発表者 ○市原寿子1)、菊地正隆1)、長谷川舞衣1)、小原光代2)、平川英樹2)、磯部祥子2)、田畑哲之2) 、中谷明弘1)
所 属 1)大阪大学 大学院医学系研究科 2)かずさDNA研究所
要 旨  Plant Genome DataBase Japan(PGDBj, http://pgdbj.jp)において、遺伝子のアミノ酸配列間の類似性とゲノム上の位置情報に基づき、各植物ゲノムデータベースのエントリー同士を繋ぐ基盤となるデータセットを構築する。このデータセットの利用により、複数生物種間で機能が同じ或いは類似する遺伝子候補の提示や、それらの遺伝子の染色体上での並び方が保存されているシンテニー様領域の検出等が可能になる。2017年7月現在、100種以上の植物のゲノム情報が公開されており、この中から、かずさDNA 研究所でゲノムを決定した植物を含む合計25種を対象としてBLAST によるアミノ酸配列の相同性検索を実施する。また、将来的な遺伝子配列の追加や修正作業を軽減する為、全配列間の類似性の計算を回避する手法を開発する。配列間の類似指標の閾値に基づき、類似した配列同士のグループを生成する。類似配列のグループ毎の特徴量として、コンセンサス配列や位置特異的スコア行列、プロファイル等の抽出と蓄積を行う。それらの特徴量同士の類似度を経由して、複数の系統群を跨って遺伝子グループを繋ぐシステムを構築する。
発表資料      doi:10.18908/togo2017.p069
番 号 70
タイトル 植物オルガネラ画像のデータベースPODBの構築と改良の取り組み
発表者 ○真野昌二1),2)、中村貴宣3)、三輪朋樹3)、西川周一4)、三村徹郎5)、長谷あきら6)、西村幹夫7)
所 属 1)基礎生物学研究所 多様性生物学研究室 2)総合研究大学院大学 生命科学研究科
3)基礎生物学研究所 情報管理解析室 4)新潟大学 理学部 5)神戸大学 大学院理学研究科
6)京都大学 大学院理学研究科 7)基礎生物学研究所 細胞生物学領域
要 旨  イメージング技術の著しい進展により、非常に多くの画像データが生み出されている。我々は、こうした画像データを植物オルガネラ研究に有効活用させるべく、オルガネラの静止画や動画を収集したThe Plant Organelles Database(PODB)を構築してきた。現バージョンのPODB3(http://podb.nibb.ac.jp/Organellome/)は、静止画を集めたOrganellome Database、動画を収集したOrganelles Movie Database、外部からの刺激に応答したオルガネラの挙動を集めたPerceptive Organelles Database、電子顕微鏡写真に対応したElectron Micrograph Database、およびオルガネラ研究用のプロトコールを集めたFunctional Analysis Database から構成されている。また、オルガネラ研究と植物科学の重要性を理解していただくことを目指したウェブサイトPlant Organelles World も構築し、広く一般の方に公開している。本発表では、PODB3およびPlant Organelles World構築と改良の取り組みについて紹介する。
発表資料      doi:10.18908/togo2017.p070
番 号 71
タイトル ppdb, Plant Promoter Database
発表者 楠和隆1)、○山本義治1),2),3)
所 属 1)岐阜大学 大学院連合農学研究科 2)岐阜大学 応用生物科学部 3)理化学研究所 環境資源科学研究センター
要 旨  植物の転写制御は形態形成や環境適応などの根幹的な生命活動を支配している。私達は転写制御の研究を進めるツールとしてプロモーター構造を表示するPlant Promoter Database(ppdb, http://ppdb.agr.gifu-u.ac.jp)を開発、運営している。基盤となる情報の多くは実験解析及び情報解析により調製されたオリジナルなものである。ppdb が対応している植物種はシロイヌナズナ、イネ、ポプラ、ヒメツリガネゴケである。

Kusunoki K, Yamamoto YY(2016) ppdb, Plant Promoter Database. van Dijik, Aalt-Jan (ed) "Plant Genomics Databases", in Methods in Molecular BIology 1533: 299-314, Springer, Dordrecht.DOI: 10.1007/978-1-4939-6658-5. Hieno A, Naznin HA, Hyakumachi M, Sakurai T, Tokizawa M, Koyam H, Sato N, Nishiyama T, Hasebe M, Zimmer AD, Dang D, Reski R, Rensing S, Obokata J, Yamamoto YY (2014) Nucleic Acids Res 42: D1188-1192.
発表資料      doi:10.18908/togo2017.p071
番 号 72
タイトル 植物におけるタンパク質の総合アノテーションデータベースの開発
発表者 〇黒谷篤之1)、Alexander A. Tokmakov2)、山田豊1)、篠崎一雄1)、櫻井哲也1),3)
所 属 1) 理化学研究所 環境資源科学研究センター 2) 京都産業大学 総合生命科学部 3) 高知大学 複合領域科学部
要 旨  近年、広範な生物種についてのゲノム解読が急速に進められており、その蓄積された塩基配列のデータ量は膨大となっている。また、これらのゲノム配列情報を有効に活用すべく、種々のポストゲノム解析も盛んに行われている。しかしながら、植物種におけるタンパク質全般の情報量は、動物や微生物等と比べて劣っており、植物の中で最も解析がされているシロイヌナズナであってもそのタンパク質の構造や機能についての注釈情報は、未だ不十分な状況である。そこで、我々は、植物種におけるこれらの欠落部分に対し、生物情報科学的なデータ生産手法によって情報の補充をすべく、ゲノム解読がされた代表的な6種の緑色植物、及び、31種の藻類について、これらのタンパク質配列データから、種々の構造的、機能的情報等を計算によって網羅的に求め、得られた結果を統合し、植物におけるタンパク質情報の総合アノテーションデータベースを作成した(http://plant-pras.riken.jp, http://alga-pras.riken.jp)。今発表では、作成したデータベースを紹介すると共に得られたデータについての概観やその応用等について報告する。

[1] Kurotani A. et al. Plant Cell Physiol. (2017), Jan 1;58(1):e6
[2] Kurotani A. et al. Plant Cell Physiol. (2015), Jan;56(1):e11
発表資料      doi:10.18908/togo2017.p072
番 号 73
タイトル 生薬国産化へ ―薬用植物総合情報データベースの構築―
発表者 ○河野徳昭、川原信夫
所 属 医薬基盤・健康・栄養研究所 薬用植物資源研究センター
要 旨  昨今の漢方薬への関心の高まりに伴い、その原料となる生薬の需要が増大している。生薬の基原植物は海外からの輸入への依存度が高く、その国内栽培化は喫緊の課題となっている。医薬基盤・健康・栄養研究所 薬用植物資源研究センターでは、植物、生薬、漢方薬に関する正しい情報を広く提供し、薬用植物資源及び生産関連技術を国民の健康増進に活用する一助とするため、漢方薬に用いられる生薬及びそれらの基原植物に関する情報を集積する「薬用植物総合情報データベース(MPDB:http://mpdb.nibiohn.go.jp)」の整備を進めている。MPDB は、製薬企業・団体、大学、研究機関等の協力を得、国内市場に流通する生薬を試料とした成分、遺伝子、生理活性等の実データに加え、基原植物の栽培法や効率的増殖法、さらには生薬及び生薬関連製剤の国際標準化に関する情報等、広範な情報を収載することを特徴とする。本発表においては、MPDB 構築を基幹とする、高品質な生薬の安定供給並びに国内栽培化を志向したセンターの取り組みについて紹介する。
*本研究は、日本医療研究開発機構研究費(創薬基盤推進研究事業)「薬用植物栽培並びに関連産業振興を指向した薬用植物総合情報データベースの拡充と情報整備に関する研究」の一環として実施した。
発表資料      doi:10.18908/togo2017.p073
番 号 74
タイトル モデル生物表現型の統合データベース J-Phenome
発表者 ○桝屋啓志1)、高月照江1)、高山英紀1)、佐藤道比古1)、谷川紀子1)、野村麻美1)、田中信彦1)、小林紀郎1),2)
所 属 1)理化学研究所 バイオリソースセンター 2)理化学研究所 情報基盤センター
要 旨  我々は、国内から公開されているモデル生物の表現型情報のポータルサイトJ-phenome(http://jphenome.info/)を公開している。本データベースは、RDFと関連技術を用いて提供元のデータベースが見える形で二次的なデータ公開をする「メタデータベース」である。系統、遺伝子の変異やバリエーション(アレル)、表現型等を、オントロジーや公共データのURI でアノテーションすることで、横断検索や他のDB との関連付けを容易にし、日本発表現型データの利用を拡大することを目的としている。
 個々のデータセットは、提供元データベースに対応した「グラフ」として作成され、それぞれ個別DB として理研メタデータベース(http://metadb.riken.jp/)によりホストされている。各DB は共通スキーマで構築され、横断検索や連邦検索も含め、SPARQL 言語による自由な検索が可能である。理研メタDB から提供される一般的な閲覧画面に加え、疾患名、遺伝子名、器官組織名などから疾患モデル生物を検索するアプリケーションからの利用も可能である。また、用途に応じた画面開発を簡便行うために、任意のテーブル表示画面を作成できるスタンザ「Stanza for Paging Table」も作成した。今後は、希少/未診断疾患、神経科学研究等、モデル生物を利用しているコミュニティとの連携を深め、表現型情報をより容易に利用できる環境を整備していきたいと考えている。
発表資料      doi:10.18908/togo2017.p074
番 号 75
タイトル 生命科学系超微細構造画像データを運用する統合メタデータベースの構築
発表者 ○久米慧嗣1),2),3)、桝屋啓志4),5)、片岡洋祐1),2),3)、小林紀郎3),4),5)
所 属 1)理化学研究所 ライフサイエンス技術基盤研究センター
2)理化学研究所 健康生き活き羅針盤リサーチコンプレックス推進プログラム 3)理化学研究所 CLST-JEOL連携センター
4)理化学研究所 バイオリソースセンター 5)理化学研究所 情報基盤センター
要 旨  細胞等の生体組織の微細構造を撮像した顕微鏡画像は、生命現象を形態情報から理解するための最も基本的なデータである。網羅的に細胞形態などからナノスケール微細形態情報が解析可能なモルフォミクス(Morphomics)技術の構築を、日本電子株式会社との連携センターにて走査型電子顕微鏡(SEM)の技術開発を中心に据えて行ってきた。その成果として、哺乳類の生体組織から約1平方ミリメートルスケールの広範囲かつ大量に生体画像データを取得し、微細形態情報のビッグデータ化に成功した。さらには、画像データにメタデータを付与して既存の生命科学系データと統合した。より具体的には、「顕微鏡オントロジー」を構築して、撮像された被写体(バイオリソース)、撮像条件、表現型等とのデータ統合を実現させ、さらに脳、肝臓、腎臓などの微細構造画像データのカタログ化を行い、理研メタデータベースから公開した。これらの成果技術を活用し、疲労病態、老化、白血病など血液腫瘍の形態学的な特徴を網羅的に捉える研究、及びそれらのカタログ化も進めている。さらに、広域超微細画像データを観察する技術開発、機械学習などに適した画像作成支援ツールの開発に取り組み、オープンな画像解析基盤の構築を強力に推進している。
発表資料      doi:10.18908/togo2017.p075
番 号 76
タイトル 理研メタデータベース:分野を超えたデータ駆動型研究を支えるメタデータ利活用基盤
発表者 ○小林紀郎1),2),3)、久米慧嗣2),4),5)、桝屋啓志1),3)
所 属 1) 理化学研究所 情報基盤センター 2) 理化学研究所 CLST- JEOL 連携センター
3) 理化学研究所 バイオリソースセンター 4) 理化学研究所 ライフサイエンス技術基盤研究センター
5) 理化学研究所 健康生き活き羅針盤リサーチコンプレックス推進プログラム
要 旨  理化学研究所(理研)は自然科学の総合研究所として生命科学、物理、化学、工学を含む広い分野の研究センターや研究室を備え、分野横断的な多種多様な研究成果データを産出している。我々は、研究成果データの利活用促進のため積極的にデータ公開に取り組んでおり、既に理研メタデータベース(http://metadb.riken.jp/)と呼ぶResource Description Framework(RDF)に準拠したデータ公開基盤を整備し、生命科学系メタデータを公開している。例えば、生物種横断的に表現型データを統合したJ-Phenome、マウス表現型の国際コンソーシアムIMPC、ラットの脳や肝臓などの電子顕微鏡画像を含む画像データベースなどのデータが公開されている。
 さらに分野を越えて、理研メタデータベースが活用されている。具体的な研究事例として、材料工学ではデータ駆動型研究を推進している材料スマート工場の実現を目指したデータ駆動型ものづくり研究、環境工学では持続可能な環境づくりを観測とシミュレーションを通じて行う研究、医工学では電子顕微鏡等の微細構造画像を活用した高速正確な細胞診研究が挙げられる。このように理研メタデータベースは、超統合メタデータの実現を通じて最先端のデータ駆動型研究を推進しており、その事例を交えて紹介する。
発表資料      doi:10.18908/togo2017.p076
番 号 77
タイトル 表現型データウェブ公開サポートシステム「Pheno-Pub」を用いた日本マウスクリニック網羅的表現型情報の公開
発表者 ○鈴木智広、古瀬民生、小澤恵代、山田郁子、田中信彦、若菜茂晴、桝屋啓志
所 属 理化学研究所 バイオリソースセンター
要 旨  日本マウスクリニックでは、国内外のマウス研究コミュニティーで開発された遺伝子改変マウスの網羅的かつ詳細な表現形解析を実施してきた(http://mouseclinic.brc.riken.jp/)。その結果、産出される各系統からの表現形解析データは400項目を超える。このような膨大な表現型情報をよりわかりやすく広く一般に公開していくため、我々は、表現型データの統計解析からウェブサイトの構築に至る一連の過程をサポートする「Pheno-Pub」と命名したオープンソースデータベースを開発した(Mamm Genome 24:473 -483, 2013)。これにより作成した日本マウスクリニック網羅的表現型情報の公開サイト(http://phenopub.brc.riken.jp/)では、閲覧者の目的を考慮し、Strain Viewer とGenotype Viewer と名付けた二つの閲覧画面で構成されている。Strain Viewer は興味ある検査パラメータを中心にさまざまな系統データを一望する、Genotype Viewer は興味ある変異遺伝子、もしくはその系統に注目して、さまざまな検査データ結果について詳細に閲覧する。さらにStrain Viewer とGenotype Viewer の解析画面はリンクしており、より自由度の高い閲覧が可能となっている。以上のことから、我々の開発したPheno-Pub システムがより多くの研究者に利用され、網羅的マウス表現型解析情報が、さまざまな研究分野の発展の一助になることを期待している。
発表資料      doi:10.18908/togo2017.p077
番 号 78
タイトル 1細胞解析に有効なヒト細胞情報データベース「SHOGoiN」
発表者 ○山根順子1)、湯地みどり1)、森智弥1)、谷山暢子1)、山根木康嗣2)、藤渕航1)
所 属 1)京都大学 iPS細胞研究所 2)兵庫医科大学
要 旨  ヒトの成体を構成する細胞は分化が進むにつれて特定の機能が決定される。現在は各細胞の詳細な1細胞オミックス解析が行われており、世界中で膨大なデータが収集されている。それらのデータを格納し、統合的に利用するためのデータベースの構築が必要とされている。
 そこで我々はヒト細胞情報の網羅的な収集・格納を行い、細胞を明確に定義するためのデータベースSHOGoiNを構築した。ヒトの成体を構成する細胞は約200細胞種と言われているが、細胞名は同じであるが解剖学的位置が異なる細胞が多数存在し、更に1細胞解析により細胞種が増加している。
 そこで、SHOGoiN では5因子(解剖学的位置、分化能、胚葉情報、体内に存在する時期、細胞種)による細胞分類情報を格納しており、その結果ヒト細胞は約3,500種に分類された。また、その他single-cell transcriptome/methylome 解析情報、マーカー情報、細胞転換情報、細胞・組織画像など多数の情報を格納している。現在NIH が主導し1細胞レベルでヒト構成細胞を決定付ける国際プロジェクトHuman Cell Atlas が進められているが、SHOGoiN はこのプロジェクトからも特筆されている。
 将来的にはこれらの情報を統合的に有効活用することによって、創薬毒性予測や再生医療にも適用可能なデータベースとなることが期待できる。
発表資料      doi:10.18908/togo2017.p078
番 号 79
タイトル 可変型遺伝子トラップクローンデータベース「EGTC」の開発及び解析
発表者 ○荒木正健、吉信公美子、中原舞、山村研一、荒木喜美
所 属 熊本大学 生命資源研究・支援センター
要 旨  一度樹立したトラップアレルのレポーター遺伝子を、Cre/ 変異lox システムを利用して任意の遺伝子に置換することが出来る可変型遺伝子トラップシステムを開発し、データベースEGTCを公開している。平成29年5月末の時点で1278クローンのES細胞株を登録しており、その中の501クローンについてマウスラインを樹立し、CARD R-BASEに寄託している。
 遺伝子トラップでは、使用しているベクターやES 細胞によって、トラップし易い遺伝子に偏りがある事が知られている。またプロモータートラップを行っているため、ES 細胞で発現している遺伝子しかトラップできないという制約がある。そこで、EGTCでトラップしている遺伝子に機能的な偏りが無いかどうかを検討した。
 トラップした遺伝子のマウス染色体上の分布の解析、KEGG Pathway解析、及びGene Ontology( GO)解析を行った。EGTC マウスラインがトラップしている遺伝子は、幅広い分野のRefSeq 遺伝子をカバーし、機能的な偏りは特に無いことを確認した。
 データベースEGTC に登録しているマウスラインは、幅広い分野におけるノックアウトマウスリソースとして有用であると考えられる。
発表資料      doi:10.18908/togo2017.p079
番 号 80
タイトル がん診療画像レファレンスデータベースの現状
発表者 ○女屋博昭、小林秀章、平岡伸介、里見介史、加藤雅志、若尾文彦
所 属 国立がん研究センターがん対策情報センター
要 旨  がん診療画像レファレンスデータベース(NCC-CIR : https://cir.ncc.go.jp)は、がんの診療に有用な放射線、CT、MR、内視鏡、超音波、病理画像等の各種臨床画像・診断情報を提供する医療従事者(主にがん専門医と一般臨床医、研修医と医学部学生)向けデータベースで、国立がん研究センターがん対策情報センターが提供するものである。
 症例ごとに注意すべき所見や診断の重要ポイントを整理し、放射線画像に対応する病理所見の提示を併せて行うなど、両者の対比を可能としている。また、コンサルテーションの際の参考情報、画像診断の初学者への教育資料としての活用や、病理診断や画像診断についてスライドなど視覚的資料を駆使した参考情報や鑑別診断に役立つコンテンツ等も用意し、症例提示とは別の観点から、がん診療に有用な教育資料としても充実させている。
 がん対策情報センター開設翌年の2007年サイトリニューアル以降も、症例提示と病理・画像診断に関する有用な診断情報コンテンツを継続的に発信、毎月約10万件のアクセス数を維持し、2017年にタブレットやスマートフォンに最適化された表示に対応し、Mobile Safari からのアクセスが最近増加している。
発表資料      doi:10.18908/togo2017.p080