new_topics

2018年度はポスター発表とワークショップを同時開催いたします。

ポスター発表・ワークショップ日程

【ライトニングトーク】 13:40~14:20  未来館ホール
【ポスター発表】    奇数番号 14:20~15:05 偶数番号 15:05~15:50  コンファレンスルーム水星+火星+金星(ひと続きの会場です)
【ワークショップ】   14:40~15:30  コンファレンスルーム水星+火星+金星前ロビー

※ポスターや発表スライド等の著作権は、別途記載がない限り発表者・発表者の所属機関に帰属します。
 ポスター・スライド内の図や文言を転用する際には、著作者と話し合っていただくよう お願いいたします。

 

ワークショップ

2018年度初めての試みとして、本シンポジウムのサブテーマ「バイオデータベース:つないで使う」をコンセプトに、NBDC事業で開発しているデータベースを他のデータベースとつなげるとできること、データベースの統合的な利活用について、会場との意見交換を踏まえながら活発な議論が行われることを期待して2題のワークショップを開催いたします。

1. ChIP-seqとプロテオーム:公共データをつないで使う:ChIP-Atlas/jPOSTチーム
種々のプロテオーム情報を標準化・統合・一元管理し、横断的統合プロテオームデータベースを開発することを目的として、jPOSTは2015年に産声を上げた。国際標準リポジトリおよび高精度データ標準化機能を深化させ、より幅広いプロテオームデータの受け皿となる機能を開発しつつある。さらに、他のオミクスとのデータ連携により、シグナル伝達や代謝のネットワーク解析を通じ、生命機能の解明に直接結びつくような解析ツールの提供を目指している。
ChIP-Atlasは、論文などで報告された世界中のChIP-seqデータを収集し、解析したデータを公開している。膨大な量のゲノムータンパク質結合データを収録しており、これらはゲノムブラウザで視覚的に理解できる。すべてのデータには固有のURLがつけられており、ダウンロードやデータ連携が円滑にできる。
本ワークショップでは、ChIP-Atlas とjPOSTが取り組んできたChIP-seqデータとプロテオームデータの連携を例として、他の公共DBとの更なる連携の可能性やそこから生まれるシナジー効果、現状の問題点やユーザー側からのニーズなどについて議論したい。

2. 日本人ゲノム多様性統合データベースTogoVarを使ってみる:TogoVar開発チーム
TogoVar(https://togovar.biosciencedbc.jp/)は、日本人のゲノムバリアントとそれに関係する疾患情報などを収集・整理したデータベース(DB)であり、2018年6月に運用を開始した。主な機能は、各バリアントDBに収録された様々な集団のアレル頻度を比較できることである。様々な人種における頻度情報を持つThe Exome Aggregation Consortium Browser(ExAC)、日本人集団の頻度情報を持つJapanese Multi Omics Reference Panel (jMorp、ToMMo)やHuman Genetic Variation Database(HGVD、京都大学)に加え、NBDCヒトDBに登録・公開されている個人由来ゲノムデータを再解析して集計した頻度情報(JGA-NGSとJGA-SNP)が含まれる。また、バリアントの位置や遺伝子名、アレル頻度、疾患名などによる検索、臨床的意義などによる絞り込みができる。
本WSでは、TogoVarの使い方をデモンストレーションすると共に、今後統合する予定のDBや検索機能を紹介する。エンドユーザーだけでなく、DB開発者からも様々なご意見をいただき、より「使える」「つながる」DBを目指す機会にしたいと考えている。ポスター発表『ゲノム研究に役立つヒトゲノムバリアントデータベース「TogoVar」』もあわせてご覧いただければ幸いである。

 

優秀ポスター賞決定

本シンポジウムでは、生命科学系データベースの開発者・利用者の活発な研究・開発意欲を奨励するため、優れたポスター発表に対して
「優秀ポスター賞」を授与します。
このたび、参加者の皆様の投票により、トーゴーの日シンポジウム2018「優秀ポスター賞」として、ポスター番号44番「ライフサイエンスデータベースを利活用したバイオインフォマティクス研究」を選出いたしました。受賞者には後日、表彰状をお送りします。

 

発表者はこちら(発表者へのご案内/PDF:625KB)を ご覧ください。  ライトニングトーク様式/PPT:151KB)

番号  代表発表者 所 属 タイトル
1 阿部貴志 新潟大学 tRNADB-CE: エキスパートがキュレートしたtRNA遺伝子データベース
2 大城戸利久 情報・システム研究機構 国立遺伝学研究所
DDBJセンター
DDBJ -登録データの拡充-
3 大田達郎 情報・システム研究機構
ライフサイエンス統合データベースセンター
大規模塩基配列データのための DDBJ Search 検索システムの開発
4 小野浩雅 情報・システム研究機構
ライフサイエンス統合データベースセンター
遺伝子発現解析の基準となるデータを快適に検索できるウェブツールRefEx
5 坊農秀雅 情報・システム研究機構
ライフサイエンス統合データベースセンター
公共遺伝子発現データベース目次AOEとそれを活用したデータ解析実例
6 仲里猛留 情報・システム研究機構
ライフサイエンス統合データベースセンター
NGSデータのエンリッチメント解析による生物学的な解釈
7 内藤雄樹 情報・システム研究機構
ライフサイエンス統合データベースセンター
GGGenome & CRISPRdirect update:ゲノム編集の実験を支援するためのウェブツール
8 横井翔 農業・食品産業技術総合研究機構 生物機能利用研究部門 昆虫学におけるデータ解析とデータベースの利用
9 藤博幸 関西学院大学 理工学部 Linked Open Dataを利用するアラインメントビューアの開発
10 山口敦子 情報・システム研究機構
ライフサイエンス統合データベースセンター
LOD連合検索の課題と展望
ータンパク質関連情報の取得を通じてー
11 守屋勇樹 情報・システム研究機構
ライフサイエンス統合データベースセンター
SPARQL support
12 川島秀一 情報・システム研究機構
ライフサイエンス統合データベースセンター
NBDC RDFポータル
13 山本泰智 情報・システム研究機構
ライフサイエンス統合データベースセンター
JSONデータを効率よくリンクトデータ化するJSON2LD Mapper
14 金進東 情報・システム研究機構
ライフサイエンス統合データベースセンター
LODQA - 自然言語によるリンクトデータ検索システム
15 櫛田達矢 科学技術振興機構
バイオサイエンスデータベースセンター
生物学的概念オントロジー由来のナレッジグラフを用いた疾患関連因子の推論
16 豊岡理人 科学技術振興機構
バイオサイエンスデータベースセンター
ゲノム研究に役立つヒトゲノムバリアントデータベース「TogoVar」
17 要匡 国立成育医療研究センター 研究所 ゲノム医療研究部 OMIMデータおよび文献情報を基本とした新規データベースと人工知能(IBM Watson)の組合せによる遺伝子関連疾患診断支援システム
18 藤原豊史 情報・システム研究機構
ライフサイエンス統合データベースセンター
希少疾患診断支援システムPubCaseFinderの社会実装を目指した取組み
19 鈴木寿人 慶應義塾大学 医学部 臨床遺伝学センター Database of Pathogenic Variant(DPV)の開設
20 坂手龍一 医薬基盤・健康・栄養研究所 難病・希少疾患創薬データベース:DDrare
21 平田誠 医薬基盤・健康・栄養研究所 難病資源研究室 PubMedのTF-IDF解析による難病創薬プロファイルの抽出
22 深川明子 医薬基盤・健康・栄養研究所
バイオインフォマティクスプロジェクト
創薬・疾患研究のためのデータベース検索システム Sagace
23 雨宮崇之 産業技術総合研究所
創薬分子プロファイリング研究センター
経済産業省関連ライフサイエンス・ポータルサイト MEDALS
24 大波純一 科学技術振興機構
バイオサイエンスデータベースセンター
生命科学データベース横断検索の継続的な発展と展望
25 川本祥子 情報・システム研究機構 国立遺伝学研究所 ナショナルバイオリソースプロジェクトのデータベースの統合化の検討
26 木村学 日本ソフトウェアマネジメント(株) ナショナルバイオリソースプロジェクトの成果論文データベースの構築と活用
27 Deden Derajat Matra Department of Agronomy and Horticulture, Bogor Agricultural University (IPB) RujakBase; an integrated web resource for the omics database of Indonesian tropical fruits
28 川原善浩 農業・食品産業技術総合研究機構 次世代作物開発研究センター、農業・食品産業技術総合研究機構 高度解析センター RAP-DB:イネアノテーションプロジェクトデータベース
29 熊谷真彦 農業・食品産業技術総合研究機構 高度解析センター TASUKE+ : 多サンプルの多型情報とGWASデータを可視化するゲノムブラウザ
30 Ghelfi Andrea かずさDNA研究所 Killer Applications in Plant GARDEN: Integration of Bioinformatics Tools for Plant Science and Breeding
31 平川英樹 かずさDNA研究所 植物ゲノム情報統合ポータルサイトPlant GARDENの構築
32 市原寿子 大阪大学 大学院医学系研究科 種を超えた植物ゲノム情報統合のためのデータリンク基盤の構築
33 原田大士朗 かずさDNA研究所 世界における植物ゲノム解析の現状と課題
34 有田正規 情報・システム研究機構 国立遺伝学研究所
DDBJセンター
MassBankメタボロームリポジトリの設計と構想
35 福島敦史 理化学研究所 環境資源科学研究センター 植物メタボロームデータの再解析・アノテーション高度化に向けた情報基盤整備
36 金谷重彦 奈良先端科学技術大学院大学 先端科学研究科 物質循環を考慮したメタボロミクス情報基盤
:KNApSAcK Family DB生体活性DBの標準化とメタ代謝マップの構築に向けて
37 曲山幸生 農業・食品産業技術総合研究機構 食品研究部門 発酵食品データベース
38 飯田啓介 情報・システム研究機構
ライフサイエンス統合データベースセンター
日本語Webコンテンツ「新着論文レビュー」サイトリニューアル
39 奥田修二郎 新潟大学 大学院医歯学総合研究科 jPOST統合環境の開発
40 田辺麻央 京都大学 化学研究所 ウイルスによるネットワークバリアントのデータベース
41 太田元規 名古屋大学 大学院情報学研究科 天然変性タンパク質データベース:IDEAL
42 横地政志 大阪大学 蛋白質研究所 PDBアーカイブの検証レポートのRDF化
43 小林直宏 大阪大学 蛋白質研究所 統合化されたNMRデータベース、BMRBと深層学習への応用
44 渡邊妙子 日本大学 大学院工学研究科 ライフサイエンスデータベースを利活用したバイオインフォマティクス研究
45 仲山慶 愛媛大学 沿岸環境科学研究センター  化学物質の環境リスク評価・リスクコミュニケーションのための公共データの活用およびChemTHEATREとAIST-MeRAMの統合利用
46 鈴木穣 東京大学 大学院新領域創成科学研究科 ヒト統合オーミクスデータベースDBKERO update 2018
47 田高周 東北メディカル・メガバンク機構、
東北大学 大学院医学系研究科
jMorp: 日本人多層オミックス参照パネル
48 小巻翔平 岩手医科大学 いわて東北メディカル・メガバンク機構 マルチオミクスゲノムブラウザiMETHYLの紹介
49 陳影 京都大学 iPS細胞研究所 SHOGoiN:1細胞解析に有効なヒト細胞情報データベース
50 粕川雄也 理化学研究所 生命医科学研究センター SCPortalen: 一細胞データ再利用のためのデータベース
51 野口修平 理化学研究所 生命医科学研究センター The FANTOM web resource, update 2018
52 京田耕司 理化学研究所 生命機能科学研究センター SSBD: 細胞・発生画像情報と生命動態情報の統合データベース
53 塩田正明 創価大学 糖鎖科学ポータルGlyCosmos Portalの開発
54 三浦信明 野口研究所 Total Glycome Databaseの構築
55 三浦信明 野口研究所 WURCS: 曖昧表記を可能とする糖鎖構造の一意的な表現の研究
56 平木愛子 野口研究所 GlycoNAVI: 疾患と複合糖質の糖鎖量比変化データベースの構築
57 新町大輔 SparqLite LLC. GlyComb: 複合糖質リポジトリの開発
58 藤澤貴智 情報・システム研究機構 国立遺伝学研究所
生命情報研究センター
MicrobeDB.jp ポータル: 統合微生物データベースのポータルサイト構築
59 森宙史 情報・システム研究機構 国立遺伝学研究所
生命情報研究センター
MicrobeDB.jpのメタゲノム解析パイプライン
60 東光一 情報・システム研究機構 国立遺伝学研究所
生命情報研究センター
微生物群集構造データの潜在環境因子の予測・可視化ツールLEA
61 厨祐喜 神戸大学 大学院科学技術イノベーション研究科 配列データおよび反応データベースを用いた微生物代謝モデルの自動構築・ツールについて
62 長正一郎 有限会社アクアラボ 健全にする生態システム制御機能(湖沼池の免疫)の扉を開く鍵
63 黄地祥子 製品評価技術基盤機構 バイオテクノロジーセンター 微生物の安全な利用に向けたNITEの情報提供の取り組み

ポスター発表詳細(ポスター情報)

番 号 1
タイトル tRNADB-CE:エキスパートがキュレートしたtRNA遺伝子データベース
発表者 〇阿部貴志1)、斉藤英司1)、後藤大起1)、池村淑道2)、山田優子1)、武藤昱3)、井口八郎1)
所 属 1)新潟大学 2)長浜バイオ大学 3)弘前大学
要 旨  tRNA遺伝子の網羅的特徴把握を目標に、公開されている原核生物の6,024の完全長ゲノム、67,053のドラフトゲノム、876のウイルス・ファージ、121の葉緑体、12の真核生物、ならびに221のメタゲノム配列を対象に網羅的な探索を行い、約417万件のtRNA遺伝を公開している(http://trna.ie.niigata-u.ac.jp)。tRNA遺伝子検索を可能な限り完全にするため、3種の予測プログラム(tRNAscan-SE, Aragorn, tRNAfinder)を併用して検索を行い、予測領域が一致しない場合、シニア世代のtRNA研究者がマニュアルにて精査を行い、その判定結果も登録している。ゲノムの登録数の増加に伴い、蓄積したtRNAの精査情報やtRNA研究者のマニュアル精査の際のチェックポイントを組み込んだtRNA判定システムを構築し、更新作業の効率化も図っている。
 本DBは世界最大規模の登録件数で、信頼性の高いDBであり、tRNAの分子生物学的な研究や微生物の進化を研究するための新規情報と解析手法を提供している。
Nucleic Acids Res. 2009;37, D163-D168. doi: 10.1093/nar/gkn692
Nucleic Acids Res. 2011;39, D210-D213, doi: 10.093/nar/gkq1007
Front. Genet. 2014;5:114. doi: 10.3389/fgene.2014.00114
番 号 2
タイトル DDBJ−登録データの拡充−
発表者 〇大城戸利久、小菅武英、児玉悠一、真島淳
所 属 情報・システム研究機構 国立遺伝学研究所DDBJセンター
要 旨  DDBJ(DNA Data Bank of Japan)は、米国のNCBI及び、欧州のEBIと協力して30年以上、世界の公共財としての『国際塩基配列データベース・コラボレーション(INSDC)』を維持し、塩基配列アーカイブと解析サービスを提供している。また日・韓・米・欧の各特許庁と協力し、特許出願された塩基配列とアミノ酸配列も公開している(DDBJは日本と韓国の特許庁データを担当)。2013年には、科学技術振興機構(JST)バイオサイエンスデータベースセンター(NBDC)と連携し、個人に由来する遺伝学的データと匿名化された表現型情報を登録するデータベース(JGA)の運用を開始し、2018年からライフサイエンス統合データベースセンター(DBCLS)との連携により、遺伝子発現量等の機能ゲノミクスデータのリポジトリとなるGenomic Expression Archive(GEA)の運用をスタートした。学術研究の進展や時代の要請に応じて、DDBJは生命科学研究の基盤となるデータベースを開発・提供している。
番 号 3
タイトル 大規模塩基配列データのためのDDBJ Search検索システムの開発
発表者 〇大田達郎、仲里猛留、坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  Sequence Read Archive(SRA)は、NCBI, EBI, DDBJによるInternational Nucleotide Sequence Data Collaboration(INSDC)が主体となって運用するNGSデータの公共データベースである。ライフサイエンス統合データベースセンター(DBCLS)ではこれまでDBCLS SRA SearchとしてSRAの検索エンジンを開発、提供してきた。しかし従来はSRAのメタデータの一部として扱われていた、研究プロジェクトやサンプル情報がBioProject, BioSampleとして別のデータベースに切り出され、NGS以外の異なる実験手法から得られたデータを横断的に検索、取得する基盤が整いつつある。我々はこの新たなデータ公開の枠組みに対応するため、DBCLS SRAの発展としてDDBJ Searchを開発した。DDBJ Searchは開発者/データサイエンティスト向けのAPIと、実験生物学者向けのGUIの双方を備え、日常的に公共データを検索・取得し、研究に活かす研究者をサポートするようデザインされている。本発表では、ベータ公開中のDDBJ Searchの特徴について紹介する。
番 号 4
タイトル 遺伝子発現解析の基準となるデータを快適に検索できるウェブツールRefEx
発表者 〇小野浩雅、坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  RefEx(Reference Expression dataset; http://refex.dbcls.jp/)は、4つの異なる実験手法(EST、GeneChip、CAGE、RNA-seq)によって得られた40種類の正常組織における遺伝子発現量を並列に表現することで、手法間の比較とともに各遺伝子の発現量を直感的に比較することが可能なリファレンスデータセットである。RefExは、種々のIDや遺伝子名、キーワードで検索できるのはもちろんのこと、任意のIDセットについても複数同時に指定して検索することができ、ある特定の検索結果を指定して得ることが容易である。また、検索結果一覧からユーザが任意で選択した遺伝子について「リスト」に追加・保持する機能を利用することで、それらの詳細情報について一画面で並列に比較することが可能である。現在、FANTOM5 CAGEデータを始めとしたRDF化されている遺伝子発現データセットに対応する遺伝子発現データビューアの開発を進め、ウェブサイト全体のリニューアルを計画している。それらの進捗等をふまえ、開発の方向性について議論したい。
番 号 5
タイトル 公共遺伝子発現データベース目次AOEとそれを活用したデータ解析実例
発表者 坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  ライフサイエンス統合データベースセンター(DBCLS)は、遺伝子発現データベース目次AOE(http://aoe.dbcls.jp/)を開発・維持している。DBCLS SRAのAPIを利用することにより、これまでのEBI ArrayExpressに加えてNCBI Gene Expression Omnibus(GEO)が目次に加わり、より多くのデータが検索可能となった。
 ただ検索ツールを作成しただけでは使われにくいため、それらをフル活用したデータ解析研究にも取り組んでいる。演者が長年取り組んできた低酸素刺激による遺伝子発現変動を公共データベースから集めてきてメタ解析を行った研究[1]とその応用事例[2]のほか、昨年の報告以降に公表した3報の共同研究による論文で実際に利用された疾患モデルにおける遺伝子発現データ解析に関しても併せて報告する。
[1] Bono H Biorxiv doi: 10.1101/267310
[2] Nakamura H et al. PLoS One. 2018; 13(2):e0192136. doi: 10.1371/journal.pone.0192136
番 号 6
タイトル NGSデータのエンリッチメント解析による生物学的な解釈
発表者 〇仲里猛留、坊農秀雅
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  近年、NGS解析が盛んに行われており、ライフサイエンス統合データベースセンター(DBCLS)でも公共NGSデータ検索サービスDBCLS SRAなどを開発してきた。NGS解析というと、マッピングや発現定量などが注目されがちだが、得られた遺伝子リストについて生物学的解釈を行うことも必要不可欠である。DBCLSでは、各遺伝子について疾患や化合物の側面から特徴づけを行うGendooシステムを開発してきた(http://gendoo.dbcls.jp/)[1]。各遺伝子について、関連文献に付与されたMeSH termsを抽出してスコアリングすることにより特徴づけを行っている。従来、生物学的な解釈としてGene Ontologyやパスウェイを用いてのエンリッチメント解析が行われているが、今回、 我々はGendooシステムを拡張し、新たに疾患や化合物の側面からエンリッチメント解析を行えるよう改良を行った。これまでは個々の遺伝子の特徴を並べているにすぎなかったが、本改良により遺伝子リストとしての特徴を示すことが可能となる。
[1] Nucleic Acids Res. 2009;37:W166-9. doi: 10.1093/nar/gkp483.
番 号 7
タイトル GGGenome & CRISPRdirect update:ゲノム編集の実験を支援するためのウェブツール
発表者 内藤雄樹
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  CRISPR-Cas9法の実験を支援するためのウェブツールとして、我々が公開している高速塩基配列検索GGGenome (http://GGGenome.dbcls.jp/)およびガイドRNA設計ソフトウェアCRISPRdirect(http://crispr.dbcls.jp/)のアップデートを紹介する。GGGenomeは、20塩基程度の短い配列をゲノム全体から高速に検索することができるツールであり、ミスマッチや挿入・欠失を含む配列であっても検索漏れがなく、ガイドRNAの特異性を確認するために役立つ。CRISPRdirectは、GGGenomeによる検索機能を利用することにより、特異性の高いガイドRNAを簡便に設計できるツールである。昨年以降のアップデートでは、各種の実験動植物や作物などのゲノムを追加したほか、GGGenome APIから取得できる情報を拡充するなど、利用者の要望をもとに改良を行なった。GGGenomeおよびCRISPRdirectは商用利用を含め誰でも無償で自由に利用でき、他のデータベースやソフトウェアとも容易に連携できる。
番 号 8
タイトル 昆虫学におけるデータ解析とデータベースの利用
発表者 〇横井翔1)、仲里猛留2)、坊農秀雅2)
所 属 1)農業・食品産業技術総合研究機構 生物機能利用研究部門
2)情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  近年、非モデル生物である昆虫においてもゲノム解析やトランスクリプトーム解析が盛んに行われるようになっており、他の生物種ではみられない多種多様な興味深い生命現象が研究されている。これらの現象を上記解析によって遺伝子レベルで明らかにすることが技術的に可能になりつつある。一方で昆虫のコミュニティへ急速に解析技術が導入されているため、データ解析やデータベース利用のリテラシーはモデル生物のコミュニティにくらべ比較的低いと考えられる。発表者らは、昆虫のコミュニティの底上げや情報交換等を目的に過去2回にわたり、ROIS-DS-JOINT共同研究集会として「昆虫のゲノムデータベースとそれを活用したデータ解析」を開催し、昆虫学の研究者がデータ解析をする際に苦労していることを共有し、昆虫学の研究者が求めているデータベースについて議論した。本発表では2回にわたる共同研究集会における議論の内容などを総括し、今後の昆虫学におけるデータ解析とデータベース利用の展望を、本シンポジウムの参加者と一緒に考え議論したいと考える。
番 号 9
タイトル Linked Open Dataを利用するアラインメントビューアの開発
発表者 〇藤博幸1)、山口敦子2)
所 属 1)関西学院大学 理工学部 2)情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  アラインメントはタンパク質の情報解析の基盤技術であり、タンパク質科学の分野をはじめとして広く利用されている。近年の配列決定技術や構造決定技術の進歩に伴い、アラインメントされる相同な配列/構造の本数が増加している。利用可能な本数の増加は情報抽出には有用である一方、大量性のために可読性が落ち、また外部情報のマッピングが困難になってきている。これまでにアラインメントや系統樹のビューアは作成されてきているが、上記の問題を満たすものはまだない。そこで今回開発のビューアでは、分子系統樹に従ってクラスタ化することでアラインメントを粗視化して表示すると同時に、系統関係や機能などについての情報を、ライフサイエンス統合データベースセンター(DBCLS)で開発されたLOD Surferをタンパク質用にカスタマイズしたPSurfer を用いてLinked Open Dataから取得し、それらの情報を系統樹、アラインメントまた立体構造上にマッピングして表示することで情報抽出をアシストできるように設計している。現バージョンのビューアの構成や機能について説明する。
番 号 10
タイトル LOD連合検索の課題と展望ータンパク質関連情報の取得を通じてー
発表者 〇山口敦子1)、藤博幸2)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター 2)関西学院大学 理工学部
要 旨  LOD上の情報をクラス間関係で切り取るシステムLOD Surferの実現へ向け、昨年度、ユーザが着目したLODデータを連合検索を通じて取得させるウェブツールLOD Surfer-APIを開発した。今年度は、ドメインを絞り、タンパク質アラインメントビューアという具体的なアプリケーション上で利用することで、LOD Surfer-APIの実用上の課題の洗い出しと、それらの課題解決による総合的な改良をめざした。その結果、(1)SPARQLエンドポイントを跨ぐ場合、クラス間パスの数が爆発的に増えるため、ユーザにクラス間パスを動的に指定させるのは現実的ではない、(2)入力数(タンパク質数)が大きくなると分散したエンドポイントへの連合検索をアプリケーション上でユーザが負担に感じない時間で動かすのは困難である、という二点が課題となった。その解決のため、課題(1)に関しては、アプリケーション開発者が推奨するパスを事前に選んで蓄積する手法を、課題(2)に関しては、事前に必要な情報を取得して蓄積する手法を採用した。本発表では、これらの開発した技術を紹介しつつ、今後のLOD Surferシステム全体の展望について述べる。
番 号 11
タイトル SPARQL support
発表者 守屋勇樹
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  バイオサイエンスデータベースセンター(NBDC)統合化推進プログラムにより、日本国内においてもこれまで多くのライフサイエンス分野のデータがRDF化され、SPARQLエンドポイントが公開されている。エンドポイントにおいて必要な情報にアクセスするためには、RDFクエリ言語、SPARQLが用いられる。そこで、SPARQLクエリ開発環境整備の一環として、クエリ記述を支援するためのツールSPARQL supportを開発した。SPARQL support では、関数や変数、PREFIX等の補完の他、クエリの管理、複数行コメントアウト等の独自機能によりSPARQLクエリ開発を補助している。SPARQL supportはオンラインで利用できる他、UserScriptとして任意のサイトで実行することや、自身のサイトに埋め込むことが可能となっている。また、SPARQLの問い合わせ結果をJavaScriptで処理したデータを返すREST API、SPARQListの記述支援ツールについても紹介する。
番 号 12
タイトル NBDC RDFポータル
発表者 〇川島秀一1)、片山俊明1)、畠中秀樹2)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター
2)科学技術振興機構 バイオサイエンスデータベースセンター
要 旨  NBDC RDFポータル(https://integbio.jp/rdf/)の現状について報告する。2015年11月の運用開始時には、10データセット、60億トリプルのデータサイズであったが、2018年7月現在、21データセット、152億トリプルと、2.5倍以上のデータ量に成長しており、さらに複数のデータセットの登録も控えている。そのため単一のVirtuosoインスタンスで運用することができず、大きなデータセット(現状ではDDBJとKEROの2つ)については、別のインスタンスをたてて運用している。本年度より、SPARQLエンドポイントのフロントエンドに、ジョブスケジューリングや、キャッシュによる応答性能向上を行うために、SPARQL proxyを設置している。また、RDFポータルガイドラインも継続的に整備しており、最近では、文献の参照や単位付き値の記述方法などについて、全データセットについて見直しを行った。
番 号 13
タイトル JSONデータを効率よくリンクトデータ化するJSON2LD Mapper
発表者 〇山本泰智1)、藤澤貴智2)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター
2)情報・システム研究機構 国立遺伝学研究所生命情報研究センター
要 旨  JSONは軽量かつ可読性が高く、Webアプリケーション等で広く使われているデータ形式である。JSON形式は、バイオ分野においても、E-Utilitiesなどの公開API、配列多重アライメントの変換仕様であるbioJSON、JBrowseリソースやデータ交換形式として利活用されている。ウェブリソースとしてすでに流通し、蓄積されているJSON形式データを、低コストでリンクト・オープン・データ(LOD)にするために、最近注目されているJSON-LD形式への変換アプリケーション、JSON2LD Mapperを開発した。
 JSON-LD形式の特徴である、データのオントロジー部分、すなわちコンテキストを独立したファイルに定義し、それをデータが記述されているファイルから参照できることから、一度定義したコンテキストは容易に多くのデータで再利用できる設計になっている。従って、本アプリの出力するコンテキストファイルをインターネット上で誰でも参照可能な状態で公開すれば、さらにLOD化の流れを加速できると考えている。
番 号 14
タイトル LODQA−自然言語によるリンクトデータ検索システム
発表者 金進東
所 属 情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  データのオープン化と統合化の重要性が高まっている中、その目的に最も適しているとされている標準手法、リンクトデータ形式でのデータの公開が広がっている。しかし、データ提供の際、自由な検索を可能とするクエリ言語であるSPARQLの利用が標準的であるが、SPARQLは言語自体の複雑度が高く、個々のデータの多様な表現形式(スキーマ)を把握しなければ適切なクエリを書けないという問題点がある。LODQAシステムは自然言語の質問文からSPARQLクエリを自動生成することによって、SPARQLクエリを書くというユーザの障壁をなくすために開発された。ユーザが入力した自然言語の質問文と検索対象のデータの表現形式を分析してSPARQLクエリを自動生成するため、SPARQL言語を知らなくても、データの表現形式に詳しくなくても、データの検索ができる。今年は、LODQAシステムのユーザーインタフェースの改良を行ったので、それを中心に紹介する。
番 号 15
タイトル 生物学的概念オントロジー由来のナレッジグラフを用いた疾患関連因子の推論
発表者 〇櫛田達矢1)、建石由佳1)、川村隆浩2)、古崎晃司3)
所 属 1)科学技術振興機構 バイオサイエンスデータベースセンター
2)電気通信大学 3)大阪大学 産業科学研究所
要 旨  生物学的概念オントロジー(http://purl.bioontology.org/ontology/IOBC)から構築したナレッジグラフを使い、疾患関連遺伝子および化合物の推論を行った。生物学的概念オントロジーをトリプルストアに格納、SPARQLを実行し、線維素溶解(血栓が分解する現象)から3ステップ以内で繋がる概念の集合のデータを獲得、このデータをCytoscapeを使ってグラフとして可視化し、これを線維素溶解ナレッジグラフと呼んだ。線維素溶解ナレッジグラフでは、「ある疾患(例、血小板凝集)に対して、それに先行して生起する生命現象(例、血栓塞栓症)」や「その生命現象を制御する機能を有する遺伝子産物(例、CLEC2)」などの知識の抽出が可能になった。ここで、その遺伝子産物がその生命現象を通して疾患を制御すると考えられることから、血栓塞栓症の関連遺伝子としてCLEC2など有力な疾患関連遺伝子候補の発見が可能になった。Gene Ontology、MeSH、ChEBIが提供する生物学的概念と遺伝子産物および化合物の関係情報を、線維素溶解ナレッジグラフに取り込んだ例では、血栓塞栓症関連遺伝子および化合物として100件以上の候補が発見された。生物学的概念オントロジー由来のナレッジグラフを対象に、SPARQL検索および、記述論理の手法を用いることで、直接的な関係は明示されていないものの、間接的に疾患に効果があることを示唆する物質(遺伝子産物、化合物)を効率的かつ正確に発見する可能性が示された。
番 号 16
タイトル ゲノム研究に役立つヒトゲノムバリアントデータベース「TogoVar」
発表者 〇豊岡理人1)、三橋信孝1)、川嶋実苗1)、片山俊明2)、川島秀一2)、建石由佳1)、藤原豊史2), 3)
所 属 1)科学技術振興機構 バイオサイエンスデータベースセンター
2)情報・システム研究機構 ライフサイエンス統合データベースセンター
3)東京大学 大学院新領域創成科学研究科
要 旨  ヒトゲノムと形質との関連を調べるゲノム研究においてリファレンスアリルと異なるバリアントのアリル頻度情報は形質のメカニズム解明に重要なヒントを与えてくれる。しかし、バリアントのアリル頻度情報はプロジェクトのウェブサイト毎に公開されている為、情報を一括して取得することは困難であった。
 そこで、我々は1)国内外のデータベースで公開されているヒトゲノムのバリアント情報を収集し、2)統一的なIDを付与することで情報の結合をより簡便にし、3)頻度情報やアノテーション情報をRDF技術によって統合し、4)ユーザが頻度情報やアノテーション情報に加え、バリアントに関連する既報論文を一括して取得できるサービス「TogoVar」を開発した。このサービスではバイオサイエンスデータベースセンター(NBDC)が運営している「NBDCヒトデータベース」からバリアント情報を収集し、頻度情報の再計算を行った。加えて、日本人集団の頻度データベースとしてToMMoのiJGVDおよび京都大学のHGVDを、国外のデータベースとしてExACからバリアント情報と頻度情報を収集した。
 ポスター発表およびワークショップでは、このサービスの詳細な機能の紹介を行う予定である。
番 号 17
タイトル OMIMデータおよび文献情報を基本とした新規データベースと人工知能(IBM Watson)の組合せによる遺伝子関連疾患診断支援システム
発表者 〇要匡1)、柳久美子1)、松原洋一2)、成富研二3)
所 属 1)国立成育医療研究センター研究所 ゲノム医療研究部 
2)国立成育医療研究センター研究所 3)沖縄南部療育医療センター
要 旨  遺伝子関連疾患は、以前より症状、遺伝子、遺伝子機能等の情報をカタログ化したOnline Mendelian Inheritance in Man(OMIM)がデータベースとして公開されている。しかしながら疾患の登録数は8,500を越え、その診断は困難なことが多い。成富は、これらの情報と文献情報を基に遺伝性疾患データベース(UR-DBMS)を構築、公開してきた。
 我々は、これら遺伝子関連疾患について、より汎用性の高い診断補助システムの構築を目指し、自然言語処理、深層学習を得意とするAI(IBM Watson)を組み合わせた診断支援システム(β版)の構築と試用を行った。
 自然言語処理による症状抽出、症状からの候補疾患の合致スコアとヒートマップによる視覚的表示、他情報付加等により鑑別が容易となるシステムとした。
 β版構築後、ATR-X症候群、Marfan症候群、Kabuki make-up症候群、結節性硬化症など16疾患、32症例について、遺伝子解析にて確定診断が行われた実際の症例に基づく症状を入力し、検討を行った。
 結果、71%において該当疾患が呈示され、遺伝子関連疾患の診断に有効であることが確認できた。
番 号 18
タイトル 希少疾患診断支援システムPubCaseFinderの社会実装を目指した取組み
発表者 〇藤原豊史1)、山本泰智1)、金進東1)、高木利久2)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター 2)東京大学
要 旨  患者の症状を入力するだけで、関連する希少疾患の候補を可能性が高い順に自動的にリストアップする、希少疾患診断支援システムPubCaseFinder(https://pubcasefinder.dbcls.jp)を紹介する。希少疾患データベースOrphanetに含まれる約4,000件の希少疾患を検索対象とし、疾患原因遺伝子を指定することで検索対象疾患を絞り込むことができる。また、各疾患には症例報告(文献)が紐付けられているので、利用者は疾患を検索するだけでなく、より具体的な過去の症例も合せて検索することが可能であり、診断の際にエビデンスとして活用できる。昨年以降のアップデートでは、利用者の要望をもとに、検索対象疾患の拡張、症状入力支援機能の改良、検索結果サマリ生成機能の追加などを行い、PubCaseFinderの社会実装を目指した改良を行った。
番 号 19
タイトル Database of Pathogenic Variant(DPV)の開設
発表者 〇鈴木寿人、上原朋子、武内俊樹、小崎健次郎
所 属 慶應義塾大学 医学部臨床遺伝学センター
要 旨  次世代シーケンサーの登場から数年を経て、網羅的遺伝子解析は以前よりも身近な診断手法になりつつある。網羅的遺伝子解析は解析者が遺伝子変異の影響を評価するために論文や遺伝子変異データベースでの報告等を参照し、検索を進める。データベースとして米国NIHが運営するClinVarが利用されることが多いが、ClinVarは欧米人から報告されたデータが多く、日本人の疾患関連遺伝子変異の登録件数は多くはない。
 DPV(http://dpv.cmg.med.keio.ac.jp/dpv-pub/top)は日本人が執筆し公開されている論文から遺伝子変異についての情報を抽出し、頻度情報などのキュレーションを経て疾患関連の遺伝子変異として登録を行っている。特に希少疾患・難治性疾患の文献データを中心に収集しており、約2,000件の遺伝子変異の登録を行った。これらの変異はWEB上で検索することも可能であり、また各施設のパイプラインに組み込むためvcfファイルのダウンロードを行うこともできる。今後、AMEDが主導する「臨床ゲノム統合データベース事業」とも連携して登録データ数を増やす 予定である。
番 号 20
タイトル 難病・希少疾患創薬データベース:DDrare
発表者 〇坂手龍一1)、深川明子1)、水口賢司1)、鍵井英之2)、佐々木隆之2)、廣實万里子2)、森田正実2)
所 属 1)医薬基盤・健康・栄養研究所 2)日本製薬工業協会 医薬産業政策研究所
要 旨  DDrare(Database of Drug Development for Rare Diseases;難病・希少疾患創薬データベース)[1]は、厚生労働省の指定難病306疾患(平成28年)を対象として、臨床試験における開発薬物と、それらの標的遺伝子・パスウェイ情報を提供している。DDrareは、医薬基盤・健康・栄養研究所と医薬産業政策研究所との共同研究の成果として開発された[2, 3]。指定難病毎にClinicalTrials.gov(米国)及びJPRN(日本)より臨床試験情報を抽出し、関連する薬物情報(DrugBank)とも連結させた。それらの薬物情報に標的遺伝子・パスウェイ情報(KEGG)を対応づけることで、「疾患」、「薬物」、「標的遺伝子・パスウェイ」情報の相互参照を可能としている(平成30年7月現在、122疾患、328薬物、284遺伝子・108パスウェイ)。DDrareの開発は、創薬ターゲット選定や発症機序解明に資することを目的として進めている。
[1] DDrare:https://ddrare.nibiohn.go.jp
[2]「 指定難病に対する臨床試験実施状況」政策研ニュースNo.48(2016.7)
[3]「 指定難病のデータベース“DDrare”の紹介」同No.54(2018.7)
番 号 21
タイトル PubMedのTF-IDF解析による難病創薬プロファイルの抽出
発表者 〇平田誠、坂手龍一
所 属 医薬基盤・健康・栄養研究所 難病資源研究室
要 旨  文章から重要語を抽出する際の特徴量として、TF-IDF(Term Frequency-Inverse Document Frequency)がある。本研究ではPubMedから難病に関する要旨を取得し、薬物及び薬物と共起する名詞句を明らかにして、難病創薬のプロファイルを明らかにすることを目的としている。ここでは、難病研究資源バンク(https://raredis.nibiohn.go.jp)のHTLV-1関連脊髄症(HAM)と多系統萎縮症(MSA)を対象とし、これらを含むPubMedの要旨(2009年~;2018年8月取得)を構文解析して名詞句を切り出した。薬物(DrugBank)が含まれる要旨内の名詞句どうしの共起と出現頻度を数え上げ、TF-IDF値を掛け合わせたものを利用した。その結果、HAMで62薬物、MSAで119薬物の情報が得られ、疾患ごと及び年代ごとの情報が明らかとなった。“Mogamulizumab”-“anti-CCR4-antibody”など、有意な共起情報を網羅的に取得できた。これらの解析を進め、疾患横断的な難病創薬プロファイルとして活用していく計画である。
番 号 22
タイトル 創薬・疾患研究のためのデータベース検索システム Sagace
発表者 〇深川明子1)、長尾知生子1)、樋口千洋1)、五十嵐芳暢2)、森田瑞樹1), 3)、陳怡安1)、坂手龍一4)、
水口賢司1)
所 属 1)医薬基盤・健康・栄養研究所 バイオインフォマティクスプロジェクト 
2)医薬基盤・健康・栄養研究所 トキシコゲノミクス・インフォマティクスプロジェクト 
3)岡山大学 大学院医歯薬学総合研究科クリニカルバイオバンクネットワーキング事業化研究講座 
4)医薬基盤・健康・栄養研究所 難病資源研究室
要 旨  医薬基盤・健康・栄養研究所では、JSTバイオサイエンスデータベースセンターと連携し、データベース横断検索システムSagace(http://sagace.nibiohn.go.jp)を開発・公開している。
 Sagaceは、創薬・疾患研究に特化した約190のデータベースを選定・分類して検索対象とし、ファセット(データベースの分類)による検索結果の効率的な絞り込みと、メタデータ(エントリーIDや生物種、データベース名など)を反映した効果的な検索結果の表示を実装した検索システムで、一般的な横断検索システムよりも創薬・疾患研究に関する情報を効率的に発見できる。
 Sagace独自に各製薬会社が公開している医薬品のインタビューフォームを検索対象に加えることで、薬理、薬物動態、毒性などの非臨床情報の検索機能を強化した。さらに内部処理の見直しを行っており、検索時間の短縮により、より効率的に創薬・疾患研究を支援する検索システムの構築を目指している。
番 号 23
タイトル 経済産業省関連ライフサイエンス・ポータルサイト MEDALS
発表者 〇雨宮崇之、福西快文、堀本勝久、福井一彦
所 属 産業技術総合研究所 創薬分子プロファイリング研究センター
要 旨  経済産業省の研究機関である産業技術総合研究所では、省庁間連携として生命科学系データベースの統合に向けたポータルサイトであるMEDALSの運用を行っている。MEDALSでは連携事業として、MEDALS便覧による情報配信を実施しており、経産省関連のデータベース、解析ツール、プロジェクト及び成果物ダウンロードに関するデータを更新している。また省庁間連携によるデータベース再構築に向けた連携として、横断検索へのデータ付加やDBのアーカイブ化を行いバイオサイエンスデータベースセンター(NBDC)と協力して公開している。加えて情報統合DBサイトなどで公開してきた解析ワークフローに関するサービスをMEDALSにおける連携活動に取り入れ、データベースとツールの連携に取り組んでいる。この解析ではデータベースのRDF化に伴い、開発した高度な解析ツール群を広く利用可能とするために、セマンティック技術に対応したフレームワークを用い、NBDCのエンドポイントと連携可能なオントロジーを利用したインターフェイスの開発を目指している。
番 号 24
タイトル 生命科学データベース横断検索の継続的な発展と展望
発表者 〇大波純一1)、杉崎太一朗2)、友田史緒里2)、牧口大旭2)、川本祥子3), 4)、畠中秀樹1)
所 属 1)科学技術振興機構 バイオサイエンスデータベースセンター 2)三井情報株式会社 
3)情報・システム研究機構 ライフサイエンス統合データベースセンター 
4)情報・システム研究機構 国立遺伝学研究所
要 旨  「散在するデータを発見しやすくする」ための情報検索基盤の価値は、近年のデータ駆動型研究や機械学習を利用した研究の拡大、オープンデータ推進の風潮に伴い、さらに高まりつつある。生命科学分野の研究データに特化した検索基盤である生命科学データベース横断検索は、今年で公開から約10年を迎えた。利用者から頂いた貴重なご意見や連携機関による多大なご協力の下、対象データベースの数も640件以上に増加し、約1億件のエントリにアクセスできる大規模なサービスに成長した。この一方で、利用者の需要や扱うデータの質も徐々に様変わりしている。例えば検索結果のリッチスニペットへの需要が増加し、NGSによるものやハイスループットな研究結果が増えるにつれ各データベースの構造も複雑になり、規模も大きくなってきている。加速的に変化し続ける生命科学データの検索基盤としての、これまでの実績と将来の展望について議論を行う。
番 号 25
タイトル ナショナルバイオリソースプロジェクトのデータベースの統合化の検討
発表者 川本祥子1)、川島靖史2)、木村学2)、木村紀子1)、佐賀正和3)、坂庭美春3)、 庄司健人2)、土屋里枝2)、
萩原宏紀2)、渡辺拓貴2)、渡邉融2)
所 属 1)情報・システム研究機構 国立遺伝学研究所 2)日本ソフトウェアマネジメント(株) 3)(株)ホロニクス
要 旨  AMEDナショナルバイオリソースプロジェクト(NBRP)・情報センターは、情報の中心として、ポータルサイトの他、650万件のデータを管理している。データベースは伝統的なRDBとして構築されており、リソースデータの管理と受発注のための、Webアプリケーションを備えている。リソースの特性情報は生物種ごとに異なっているため、データベースに互換性はなく、新しいタイプのリソースが追加されるたびにWebアプリケーションを一から構築するなど、拡張性に欠けており、維持管理の効率化が目下の課題となっている。本発表では情報センターで管理するデータベースの現状を報告し、今後の運営に関してRDF化も含め、参加者からのコメント、アドバイスを受けたいと考えている。
番 号 26
タイトル ナショナルバイオリソースプロジェクトの成果論文データベースの構築と活用
発表者 木村学1)、川島靖史1)、庄司健人1)、土屋里枝1)、萩原宏紀1)、渡辺拓貴1)、渡邉融1)、川本祥子2)
所 属 1)日本ソフトウェアマネジメント(株) 2)情報・システム研究機構 国立遺伝学研究所
要 旨  ナショナルバイオリソースプロジェクト(NBRP)は、ライフサイエンス研究の基礎・基盤となるバイオリソース(動物、植物等)について収集・保存・提供などの整備を行っている。成果論文データベースRRC(https://rrc.nbrp.jp/)は、NBRPリソースを使用して行われた研究成果を集約したデータベースとして、リソースの価値を高めることに寄与している。研究成果のさらなる活用を目的に、今回データベースの改訂を行った。主に、インパクトファクターなどの新たなメタ情報・全体および生物種固有の統計情報の追加を行い、どんなリソースが成果に結びついているのか、どんな論文が注目されているのかを明らかにした。さらにデータベースに登録されたデータの利用を図るために、ディープラーニングを用いた解析を進め、論文の要旨を使って、リソースを作成した論文と、リソースを利用した論文の分類を試みたのでその結果を発表する。
番 号 27
タイトル RujakBase; an integrated web resource for the omics database of Indonesian tropical fruits
発表者 〇Deden Derajat Matra1)、 Arya Widura Ritonga2)、 Winarso Drajad Widodo1)、
Sobir2)、 Roedhy Poerwanto1)
所 属 1) Crop Production Science Division, Department of Agronomy and Horticulture, Bogor Agricultural University (IPB)
2) Plant Breeding Division, Department of Agronomy and Horticulture, Bogor Agricultural University (IPB)
要 旨  Genetic resources of fruits native to Indonesia is the richest in the tropical region and has a great potential in the future utilization. The purpose of database is to collect, analyze, integrate genetics, genomics, transcriptomics, and metabolomics data to enhance more rapid research progress. The database can be accessed at http://www.rujakbase.id. All of the content includes organisms, sequence analysis, and publication were retrieved from public databases like NCBI and other reliable sources. Currently, the RujakBase manages 11 genera of Indonesian native fruits.
番 号 28
タイトル RAP-DB:イネアノテーションプロジェクトデータベース
発表者 〇川原善浩1), 2)、岸川(広実)朋子2)、王暁輝1)、脇本泰暢3)、伊藤剛2)
所 属 1)農業・食品産業技術総合研究機構 次世代作物開発研究センター 
2)農業・食品産業技術総合研究機構 高度解析センター  3)ビッツ株式会社
要 旨  イネは世界で最も重要な作物のひとつであり、2004年に作物では最も早くゲノム解読が完了した。そして、農業上重要な形質に関係する様々な遺伝子の単離や機能解析、DNAマーカー等を利用した分子育種等が精力的に進められている。このような研究において、ゲノム配列や遺伝子アノテーション情報はもっとも重要な基盤情報である。イネアノテーションプロジェクトデータベース(RAP-DB)は2006年よりイネのリファレンスゲノム配列やアノテーション情報の提供を開始し、10年以上が経った現在でも国内外の数多くの研究者から参照される基盤データベースとして利用されている。近年はOryzabase(NBRP、遺伝研)とも連携し、日々公表される学術論文を研究者が精査し、遺伝子構造や機能情報等の追加、修正を行う遺伝子情報 キュレーションに取り組み、最新のイネの遺伝子情報を提供するよう努めている。本発表では、RAP-DBが提供する遺伝子アノテーション情報や解析ツール、昨年より公開している300種以上のイネ品種のゲノム多様性情報を提供するブラウザについても紹介する。
RAP-DB: https://rapdb.dna.affrc.go.jp
Sakai, H., et al., Plant & Cell Physiol., 54(2):e6 (2013)
Kawahara, Y., et al., Rice, 6:4 (2013)
番 号 29
タイトル TASUKE+:多サンプルの多型情報とGWASデータを可視化するゲノムブラウザ
発表者 〇熊谷真彦1)、西川大貴1), 2)、川原善浩1), 3), 4)、脇本泰暢5)、 伊藤龍太郎2), 4)、田部井紀雄2)、
田中剛1), 3), 4)、伊藤剛1), 4)
所 属 1)農業・食品産業技術総合研究機構 高度解析センター 2)株式会社ダイナコム 
3)農業・食品産業技術総合研究機構 次世代作物開発センター 4)農業生物資源研究所 5)ビッツ株式会社
要 旨  100を超える多サンプルのゲノムリシーケンスデータから得られる多型情報やGenome Wide Association Study(GWAS)の解析結果を幅広い解像度で情報量豊かに表示するウェブブラウザを開発した。近年のシーケンシング技術の進展により多量のゲノムデータが得られるようになり、同時に遺伝的多型と表現型との関連を解析するGWAS研究も盛んに行われている。これらの情報を誰もが簡単な操作で閲覧することを可能にし、また一般に向けて公開することでデータの利活用を促進することを目的としている。TASUKE+は数百サンプルのリシーケンスデータを参照ゲノムへマッピングして得られた一塩基多型や挿入欠失といった多型情報およびそれらの遺伝子への効果情報、デプス情報、遺伝子アノテーション情報、GWASのマンハッタンプロット等を並列的に表示し、1 bpの解像度から最大20Mbまでの広い範囲の情報をスムーズに閲覧することが可能である。これにより、各サンプル間の関係を遺伝子から広域なゲノム領域のレベルで理解することができ、またGWAS結果から表現型多型の原因遺伝子の候補を探索することが容易になる。さらにゲノムデータの閲覧から得られた情報を実験で活用するため、任意の多型サイトや領域に対して、多型情報を考慮したプライマーの設計や系統樹作成等の様々な機能が実装されている。
番 号 30
タイトル Killer Applications in Plant GARDEN:Integration of Bioinformatics Tools for Plant Science and Breeding
発表者 〇Ghelfi Andrea、藤代継一、白澤健太、原田大士朗、小原光代、平川英樹、田畑哲之、磯部祥子
所 属 かずさDNA研究所
要 旨  In order to advantage the utilization of Plant GARDEN, we have developed new tools for gene prediction, annotation, haplotype-specific expression (HSE), and also variant calling analysis. Variant calling is a web-based service, provides the most popular softwares used for SNP identification. Hayai-Annotation is an ultra-fast and accurate R-package with GUI for gene annotation. HSE is a package that first haplotypes alleles and then perform analysis of specific expression and variant calling.
番 号 31
タイトル 植物ゲノム情報統合ポータルサイトPlant GARDENの構築
発表者 〇平川英樹1)、原田大士朗1)、Andrea Ghelfi1)、Jeffrey Fawcett1)、白澤沙知子1)、市原寿子2)、
中谷明弘2)、磯部祥子1)、田畑哲之1)
所 属 1)かずさDNA研究所 2)大阪大学 大学院医学系研究科
要 旨  現在、モデル植物や実用作物など多種多様な植物のゲノム配列が解読されている。近年のシークエンシング技術の 進展により、今後、迅速にかつ高精度でゲノム配列が解読され、より多様な植物のゲノム配列が明らかになると考えられる。一方、様々な品種についてリシークエンスや転写産物の解読も行われており、品種間の塩基配列やゲノム構造の違いが調べられている。従来の統合化推進プログラムでは植物ゲノム統合ポータルサイトPGDBj(http://pgdbj.jp)を構築し、緑色植物40種とラン藻213種のオルソログ、65植物種約26万件のDNAマーカー、45種約1万6千件のQTL情報を公開した。第三期では、ゲノムワイドなデータに対応するようPGDBjの内容を一新し、新たにPlantGARDENを構築する。各植物で公開されているゲノムワイド多型情報をゲノムブラウザ上に集約させ、さらに、複数植物間での遺伝子配列の類似性に基づいたデータリンク基盤を構築することで、ゲノムを横断的に比較できるシステムを開発する。また、ユーザがNGSデータを投入しSNP解析を実施できるカスタム型多型・ハプロタイプ検出システムを構築している。
番 号 32
タイトル 種を超えた植物ゲノム情報統合のためのデータリンク基盤の構築
発表者 〇市原寿子1)、原田大士朗2)、Jeffrey Fawcett2)、白澤沙知子2)、小原光代2)、 菊地正隆1)、長谷川舞衣1)、平川英樹2)、磯部祥子2)、田畑哲之2)、中谷明弘1)
所 属 1)大阪大学 大学院医学系研究科 2)かずさDNA研究所
要 旨  統合化推進プログラムにおいて2017年から構築を開始した、植物ゲノム情報統合ポータルサイトPlant GARDENの中で、各植物ゲノムデータベース間のエントリーを繋ぐ基盤となるデータセットを構築している。エントリーの連結は、遺伝子のアミノ酸配列の類似性とゲノム上の位置情報に基づき実施している。これまで300種を超える植物ゲノムの解析報告がなされ、データセットの構築においては将来的な遺伝子配列の追加・更新作業を軽減するための2つのアプローチを採用している。一方は、植物の分類体系に沿って種、属、科などの各階層に属する生物種を一つの 集合体とし、纏められた生物種の持つ遺伝子全てを一つのゲノムセット(パンゲノム)として扱っている。各階層のパンゲノムに含まれる遺伝子間のアミノ酸配列比較を行い、組み合わされる集合間で同一の遺伝子配列を積集合として扱うことにより、重複分に対し計算量の軽減が期待される。他方は、アミノ酸配列比較に際して配列プロファイルを生成して複数配列の情報を圧縮し、「配列vs配列」から「配列vsプロファイル」とすることで計算量の軽減を図っている。本発表では、これらの効果について議論する。
番 号 33
タイトル 世界における植物ゲノム解析の現状と課題
発表者 〇原田大士朗1)、市原寿子2)、中谷明弘2)、Ghelfi Andrea1)、 藤代継一1)、小原光代1)、平川英樹1)、
田畑哲之1)、磯部祥子1)
所 属 1)かずさDNA研究所 2)大阪大学 大学院医学系研究科
要 旨  近年、シーケンシング技術の発展に伴い、より安価で効率的にゲノム解析がおこなえるようになった。モデル植物 以外の種でも日々新たにゲノム解析がおこなわれており、2018年上半期だけでも約40種の植物において新規にゲノム解読がなされた。現時点で340種以上の植物ゲノムが解読されており、今後も新たな植物ゲノム情報が加速的に明らかになると考えられる。また、すでにゲノム解読がなされた植物種でもリシーケンシングがおこなわれ、解析の精度も年々向上している。
 このように植物ゲノム情報は世界的に拡充してきているが、いまだ課題も多い。多くのゲノム情報は個別のWEBデータベース上で管理されており、植物ゲノムを網羅したポータルとなるWEBページは存在しない。現在開発中である植物ゲノム情報統合ポータルサイトPlant GARDENは、ゲノム解析がおこなわれているほぼ全ての植物種を網羅し、ゲノムだけでなくトランスクリプトーム、マーカー、変異、形質などの情報も提供する総合ポータルサイトである。
 本発表では植物ゲノム情報をキュレーションするうえで見えてきた植物ゲノム解析の現状と課題を紹介する。
番 号 34
タイトル MassBankメタボロームリポジトリの設計と構想
発表者 〇有田正規1)、金谷重彦2)、櫻井望1)、平川英樹3)、福島敦史4)
所 属 1)情報・システム研究機構 国立遺伝学研究所 DDBJセンター 2)奈良先端科学技術大学院大学 情報科学領域 
3)かずさDNA研究所 4)理化学研究所 環境資源科学研究センター
要 旨  メタボロームデータの公共リポジトリには欧州EBIのMetaboLights、米国NIHの MetabolomicsWorkbenchがある。しかしそれ以外に大きなサイトは存在せず、また学術雑誌もデータのオープンアクセス化を義務付けていない。この状況を打開するため、国立遺伝学研究所が中心となってメタボロームデータの寄託先を設立する予定である。ゲノムと異なり、メタボロームデータは再解析が難しい。多くの情報をメタデータとして記載してもらうべく、現在は目的別のメタデータ・フォーマットを作成している。メタデータは国際メタボロミクス学会の標準(MSI)に準拠し、内容は上記海外リポジトリと交換したい。ただし、投稿されるバイナリ・データの中身を逐一チェックすることは難しい。同定された代謝物リストを付与するなど、再解析を容易にする工夫を考える必要がある。本発表ではメタデータの進捗状況、全体構想、これまでのMassBankとの関係について説明する。
番 号 35
タイトル 植物メタボロームデータの再解析・アノテーション高度化に向けた情報基盤整備
発表者 〇福島敦史1)、津川裕司1)、高橋みき子1)、小林紀郎2)
所 属 1)理化学研究所 環境資源科学研究センター 2)理化学研究所 計算工学応用開発ユニット
要 旨  ライフサイエンスにおいて、データ測定方法の標準化と、データの再利用性確保とを目的とした枠組み整備は火急の課題である。メタボロミクスにおいては、ウェブ国際標準規格に沿ったRDF形式のメタデータ整備を含む生データの公開が未整備である。蓄積したデータの再解析や他データとの統合を通して、研究の再現、既存アノテーションツールの検証、データ測定の品質向上、機械学習精度向上ならびに新たな知見創出への貢献が期待される。
 統合化推進プログラム「物質循環を考慮したメタボロミクス情報基盤」において、我々の研究グループでは、「植物データアノテーション高度化」を目指している。理研CSRSが保有するメタボローム測定データを精査して、理研メタデータベース(http://metadb.riken.jp/)から、さらには将来的に構築されるMassBank公共リポジトリから公開していく計画である。本発表では、データ再解析のための解析ソフトウェア開発[1]をはじめとした情報基盤整備の計画とこれまでの進捗について述べる。
[1]MS-DIAL(http://prime.psc.riken.jp/Metabolomics_Software/MS-DIAL/
番 号 36
タイトル 物質循環を考慮したメタボロミクス情報基盤:KNApSAcK Family DB
生体活性DBの標準化とメタ代謝マップの構築に向けて
発表者 〇金谷重彦、森田晶、小野直亮、江口遼平、Md. Altaf-Ul-Amin、黄銘
所 属 奈良先端科学技術大学院大学 情報科学領域
要 旨  オミクスと薬用/食用の知識を統合的に扱ったプラットフォームに従ってデータベースを構築すれば、社会の最重要課題である「健康」「医薬」を課題とした情報を体系的に検討できる。そこで、メタボローム研究を中心に薬用・植物知識ベース(機能性、配 合)、さらにヒト生理活性を統合的に扱うデータベースKNApSAcK Family DB(http://kanaya.naist.jp/KNApSAcK_Family/)[1]の構築を進めている。KNApSAcK Core Systemには、生物種と二次代謝物の関係データ情報が整理されており、現在までに、114,238種の生物種-二次代謝物の関係、二次代謝物の総数は51,086種となっている。また、白井ら(長浜バイオ大学)の開発した代謝物の三次元グラフマッチングアルゴリズム(COMPRIG)により、Twins DBにおいては二次代謝物間の類似性を検索することが可能になった。現在までに、生物種、二次代謝物にかかわる15種のデータベースの開発を進めている。構築されているKNApSAcK family DBに物質循環を考慮したメタボロミクス情報基盤について、生体活性DBの標準化とメタ代謝マップをどのように統合するかについてプロトタイプDBを通してポスターにて発表する。
[1] Afendi FM et al., KNApSAcK family databases: integrated metabolite-plant species databases for multifaceted plant research, Plant Cell Physiol. 53, e1 (2012).
[2] Saito M, Takemura N, Shirai T, Classification of ligand molecules in PDB with fast heuristics graph match algorithm COMPLIG. J. Mol. Biol. 424, 379-390 (2012)
番 号 37
タイトル 発酵食品データベース
発表者 〇曲山幸生、楠本憲一
所 属 農業・食品産業技術総合研究機構 食品研究部門
要 旨  日本には多くの伝統発酵食品が存在する。それらは単なる食品にとどまらず、生活に密着して食文化の一部として受け継がれてきた。現代の科学技術から見ても、その微生物制御技術は高度で繊細であり、人の健康を維持する機能性物質が豊富に含まれていることが次々に明らかになってきている。今日、伝統野菜と呼ばれる地域の在来品種を使った漬物等は、ブランドとしての価値も高く、地域の経済を支える役割も果たしている。このように、発酵食品には多くの側面があり、様々な方面から注目されている。
 そこで私たちは、発酵食品に注目している様々な分野の人たちに利用してもらうために、発酵食品に関する総合的で膨大な情報の入口を提供したいと考えた。この目的のために、取り扱う情報の種類は、①食品(その派生製品、料理、成分も含む)、②関連する微生物(微生物株だけでなく、麹のような複合系も含む)、③関連する原材料、④関連する食文化、⑤根拠となる文献、⑥問合せ先の6種類の主要データに加え、生理機能、ファイル(画像や資料)の2種類の補足データを対象とし、それらの間を関連付けたリレーショナルデータベースを構築した。現在までに味噌等を中心にデータを登録し、文献数は約2万件に達している。
番 号 38
タイトル 日本語Webコンテンツ「新着論文レビュー」サイトリニューアル
発表者 〇飯田啓介1)、小野浩雅1)、建石由佳2)、山本泰智1)
所 属 1)情報・システム研究機構 ライフサイエンス統合データベースセンター 
2)科学技術振興機構 バイオサイエンスデータベースセンター
要 旨  ライフサイエンス統合データベースセンターは、2010年9月より、日本語Webコンテンツとして「ライフサイエンス 新着論文レビュー」を公開している。これは、トップジャーナルに掲載された日本人を著者とする生命科学分野の論文について、論文の著者自身の執筆による日本語のレビューを、だれでも自由に閲覧・利用できるよう、いち早く公開するもので、すでに1,200本以上が公開されている。今回、「新着論文レビュー」が単なる解説記事としてだけでなく、データベースやテキストなどさまざまなコンテンツのプラットホームへと発展する足がかりとなることをめざして、サイトを全面的にリニューアルした。「新着論文レビュー」の全文をJSTシソーラスやライフサイエンス辞書などを用いて形態素解析することにより、計算機により、タンパク質名や遺伝子名、専門用語など、アノテーションすべき単語を選び出した。サイトにおいてそれらの単語をマウスオーバーすると、関連するデータベースや、ウィキペディアでの解説文へのリンクが表示される。これにより、「新着論文レビュー」からシームレスにさまざまなデータベースへのアクセスが可能になり、利便性が高まった。
番 号 39
タイトル jPOST統合環境の開発
発表者 〇奥田修二郎1)、渡辺由1)、守屋勇樹2)、河野信2)、松本雅記3)、高見知代3)、小林大樹4)、山ノ内祥訓5)、 荒木令江4)、吉沢明康6)、田畑剛6), 7)、岩崎未央7)、杉山直幸6)、田中聡8)、五斗進2)、石濱泰6)
所 属 1)新潟大学 大学院医歯学総合研究科 2)情報・システム研究機構 ライフサイエンス統合データベースセンター 
3)九州大学 生体防御医学研究所 4)熊本大学 大学院生命科学研究部 5)熊本大学 医学部附属病院 
6)京都大学 大学院薬学研究科 7)京都大学 iPS細胞研究所 8)Trans-IT
要 旨  jPOST(https://jpostdb.org/)では、日本内外に散在している種々のプロテオームデータを統合し、統一された信頼基準で結果を解釈するために、(1)質量分析計から出力される生データを含む、プロテオームデータを投稿・蓄積するためのリポジトリ、(2)生データを再解析するための標準化されたワークフロー、(3)再解析後の高品質なプロテオームデータを蓄積・可視化するデータベースの3つを開発してきた。本年度から新たなプロジェクトとして、他のオミクス・データベースと連携し、シグナル伝達ネットワークや代謝ネットワーク等へのマッピングによって、生体分子による細胞機能、生命機能の解明に直接結びつくような解析ツールの開発を始めた。開発にあたっては、ゲノ ム変異情報を積極的に利用したプロテオゲノム解析や、腸内細菌叢などの多生物集団に対するメタプロテオーム解析から得られるデータも扱うとともに、メタボロミクス、グライコミクス等についてもその情報を取り込んだ解析を可能にすることを目標とし、幅広く生命科学研究者に利活用されるデータベースを構築する。
番 号 40
タイトル ウイルスによるネットワークバリアントのデータベース
発表者 〇田辺麻央、金久實
所 属 京都大学 化学研究所
要 旨  2017年12月に公開したKEGG NETWORKは、ヒトの疾患や医薬品の効果を生体システムを構成する分子ネットワークのゆらぎと関連づけるという新しい概念に基づくデータベースである。ネットワークのゆらぎはヒト遺伝子バリアント、ウイルスその他の病原体、環境因子、医薬品などによってもたらされ、これを表現するためにレファレンスとなるネットワーク要素と様々なバリアントのネットワーク要素の集合としてKEGG NETWORKデータベースを構築している。ここではウイルスに着目し、4種類のウイルス(KSHV, HPV, HCMV, HIV)の感染に伴うシグナル伝達ネットワークの変化をネットワークバリアントとして定義しデータベース化を行った。このうちKSHVとHPVは腫瘍ウイルスであり、増殖シグナルの活性化やアポトーシスの抑制など、ヒト遺伝子のバリアント(変異や融合遺伝子など)と類似のメカニズムが見られる。またKSHVとHCMVは宿主タンパク質を模倣(viral mimicry)することで免疫応答を回避しており、HIVはより直接的に免疫系を阻害している。このようにウイルスがとる戦略の比較解析も紹介する。
番 号 41
タイトル 天然変性タンパク質データベース:IDEAL
発表者 〇太田元規1)、嘉戸裕美子1)、坂本盛宇2)、細田和男3)、小池亮太郎1)、廣明秀一4)、福地佐斗志3)
所 属 1)名古屋大学 大学院情報学研究科 2)(株)ホロニクス 3)前橋工科大学 工学部 4)名古屋大学 大学院創薬科学研究科
要 旨  タンパク質の鎖の中で立体構造を形成しない部分を天然変性領域といい、天然変性領域を有するタンパク質を天然変性タンパク質という。天然変性タンパク質は、シグナル伝達・転写調節に関与するとともに、リン酸化といった翻訳後修飾部位を多く含み、タンパク質の機能に大きく関わっている。我々は天然変性タンパク質データベース:IDEAL(http://www.ideal.force.cs.is.nagoya-u.ac.jp/IDEAL/)を開発、運営している。IDEALでは、PDBのミッシング領域に加え機械的に収集する事が難しい実験的に確認された天然変性領域の情報を論文から収集している。また、天然変性領域中の相互作用部位をProSと呼び注釈付けしている。最近になり、天然変性部位のリン酸化に注目し、リン酸化を契機とする生物学的イベントの記述について検討を始めた。IDEALには2018年7月現在、913配列、9,004天然変性領域、559Prosが収録されており、天然変性タンパク質のデータベースとして世界最大の規模を誇っている。
番 号 42
タイトル PDBアーカイブの検証レポートのRDF化
発表者 〇横地政志1)、金城玲1)、藤原敏道1)、中村春木1), 2)、栗栖源嗣1)
所 属 1)大阪大学 蛋白質研究所 2)情報・システム研究機構 国立遺伝学研究所
要 旨  PDBアーカイブの検証レポートは、X線回折、核磁気共鳴、電子顕微鏡の構造決定法毎に専門委員会(Validation Task Force)の意見を取り入れ、広く受け入れられている評価基準を使って、決定された構造の品質を評価する文書です。主に学術誌の編集者や査読者に、論文の投稿・査読過程で、この検証レポートを使用することが推奨されています。
 PDBjグループは、構造を評価する指標に基づいた検索を容易にするため、検証レポートの代替フォーマット(PDBx/mmCIFと高い互換性のあるXML版とRDF版)を開発しました。構造に基づくバイオインフォマティクス、 創薬の分野において、新しいアーカイブの活用が期待されます。発表会では、アーカイブの概要とその応用を説明します。
番 号 43
タイトル 統合化されたNMRデータベース、BMRBと深層学習への応用
発表者 〇小林直宏1)、横地政志1)、岩田武史1)、宮ノ入洋平1)、児嶋長次郎2)、藤原敏道1)
所 属 1)大阪大学 蛋白質研究所 2)横浜国立大学 大学院理工学府
要 旨  大阪大学蛋白研PDBj-BMRBでは米ウイスコンシン大学を始めとするwwPDBによる国際協力の下、NMR実験データベースの登録、データ管理、運営、公開を行ってきました。我々のグループはデータエントリをほぼ全自動的にオントロジに基づいた厳密な検証によりXML化およびRDF化を行い、SPARQLエンドポイントの公開も行っています。また公開用WEBページはそれらによる高度な検索サイトとして利便性を向上させてきました。この検索サイトでは他の生命科学系データベース間での連携を強化し、文献情報、配列相同性、相互作用情報などNMRデータを起点とした豊富な研究戦略立案などに貢献できると期待できます。
 最近ではBMRBのデータを利用して深層学習により強化された解析ツールを開発公開し、既に数件の新規フォールド解明に貢献しました。限られたNMRデータを使って高速かつ正確に解析可能であり、信頼性の高い実験データが今後BMRBに蓄積されれば更なる発展が期待できます。
番 号 44
タイトル ライフサイエンスデータベースを利活用したバイオインフォマティクス研究
発表者 〇渡邊妙子1)、吉田尚恵1)、武田伊織1)、小野洋一2)、中野善夫3)、山岸賢司1)
所 属 1)日本大学 大学院工学研究科 2)日本大学 本部研究推進部知財課 3)日本大学 歯学部
要 旨  現在、様々なライフサイエンスデータベースが公開されている。私たちの研究室では、それらを利活用したバイオインフォマティクス研究を進めている。本発表では以下に示す研究内容について紹介する。
1. 生体分子に対する分子シミュレーション解析では、Protein Data Bank(PDB)を利用して、生体分子の構造と機能の解析を行っている。近年では、核酸分子とその標的蛋白質との相互作用について解析を進め、新機能性核酸分子の開発を目指している。
2. 口腔内サンプル由来の細菌叢メタゲノム解析では、NCBIのゲノムデータベースを利用し、16S rRNA遺伝子に依 存しないNグラム配列に基づく細菌叢解析法の開発を進めている。
3. AR技術を用いた分子構造表示システムの開発では、ChemDBやCCDC(Cambridge Crystallographic Data Centre)などの分子構造データベースと連動して、分子構造をAR表示できる携帯端末の開発を進めており、化学教育への展開を目指している。
番 号 45
タイトル 化学物質の環境リスク評価・リスクコミュニケーションのための
公共データの活用およびChemTHEATREとAIST-MeRAMの統合利用
発表者 〇仲山慶1)、林彬勒2)、磯部友彦3)、宇野誠一4)、半藤逸樹5)、大野暢亮6)、国末達也1)
所 属 1)愛媛大学 沿岸環境科学研究センター 2)産業技術総合研究所 3)国立環境研究所 4)鹿児島大学 水産学部 
5)新潟大学 教育研究院自然科学系 6)兵庫県立大学 大学院シミュレーション学研究科
要 旨  化学物質の環境リスクは、基本的に予測環境濃度(PEC)と予測無影響濃度(PNEC)の比に基づいて評価される。PECは環境中の化学物質濃度の実測データ等をもとに決定するのが理想的ではあるが、環境モニタリングに要するコストを考えると現実的ではない。実際には、多くのケースで十分な実測データが存在しないため、排出量に基づいて算出された予測濃度がPECとして用いられている。環境省が実施した予測濃度の妥当性評価によると、予測濃度と実測濃度の差異は化合物によって大きく異なることが示されており、予測精度の向上が求められている。そのためにも環境モニタリングによる実測データの把握が重要であり、環境省や地方自治体では一部の化学物質のモニタリングが継続的に実施されているが、それらの結果は散在している上、PDF形式のように二次分析に利用しづらい形式にて公開されていることがほとんどである。そこで、ChemTHEATREでは公共データの二次利用を推進するために、関連データの収録・公開を開始した。この収録データを生態リスク評価管理ツールAIST-MeRAMに受け渡し、実測値ベースでの迅速なリスク判定を可能としている。
番 号 46
タイトル ヒト統合オーミクスデータベースDBKERO update 2018
発表者 鈴木穣
所 属 東京大学 大学院新領域創成科学研究科
要 旨  我々のグループで開発するデータベースDBKERO(http://kero.hgc.jp)では、ヒトゲノム多型・変異に生物学的機能注釈を与えるべく、臨床検体、培養細胞モデルの両面から多層オーミクスデータの統合を行っている。臨床検体データについては、今期、本データベースではCREST が終了するIHEC(国際エピゲノムコンソシアム)データの本邦での受け皿となるべく、日本チームの作成した正常肝臓、血管内皮、胎盤組織におけるエピゲノムカタログ(94検体からなるヒストン修飾、DNAメチル化、RNASeqの合計621データセット)を標準エピゲノムデータとして収載、ブラウズを可能とした。これに加えて東大徳永らの運営するヒトゲノム多型データベースとも融合し、HLA領域を含む多型情報さらに17 のGWAS解析より得られた日本人ゲノム多型を正常検体8,757検体、疾患検体6,816検体について公開した。
 細胞モデルデータについては、約50種類のシングルセルデータ及びMinIONを用いて収集したヒトがんゲノムロングリードを公開した。また、これらのデータについて、統合オーミクス解析を可能とする一連のツール群についても公開を開始している。特に筆者らが今回公開した発現モジュール解析例について、肺腺癌細胞をモデルに詳解する。
番 号 47
タイトル jMorp:日本人多層オミックス参照パネル
発表者 〇田高周1), 2)、三枝大輔1), 2)、元池育子1), 2), 3)、井上仁1), 2)、青木裕一1), 2), 3)、
城田松之1), 2), 3)、植木優夫1)、牧野悟士1)、五丁千夏1)、小島要1), 2)、加賀谷祐輝3)、
小柴生造1), 2)、勝岡史城1), 2)、田宮元1)、清水厚志5)、山本雅之1), 2)、木下賢吾1), 3), 4)
所 属 1)東北メディカル・メガバンク機構 2)東北大学 大学院医学系研究科 3)東北大学 大学院情報科学研究科 
4)東北大学 加齢医学研究所 5)岩手医科大学 いわて東北メディカル・メガバンク機構
要 旨  東北メディカル・メガバンク機構(ToMMo)では東北メディカル・メガバンク事業における地域住民コホート調査に参加いただいた日本人5,093 人(男性433人、女性575人)の血漿サンプルの統合解析を行い、日本人集団における血漿中の代謝物の濃度分布やタンパク質の頻度分布を明らかにした。このような情報は疾患バイオマーカーの探索や、疾患予防や早期診断を行う際に有用な情報源になり得る。解析結果はjMorp(Japanese Multi Omics Reference Panel; https://jmorp.megabank.tohoku.ac.jp)にて公開している。2018年6月現在では、NMRで同定された37化合物の濃度分布、LC-MSで検出された257代謝物のピーク強度分布、加えて256タンパク質(男性190人、女性311人)の測定頻度を公開している。
 また、メタボローム・プロテオーム情報にとどまらず、2018 年6月には日本人3,552人の全ゲノム解析から得られたアレル頻度情報をjMorpにて公開を始めた。これによりさらなる多層データ統合を推し進めてゆく。また、今後、解析サンプル数の増加や同定物質の種類を増加することでパネルの精度を目指し、また、ゲノム情報等との関連解析結果の増加を図ることでデータベースコンテンツの拡充を目指す。
番 号 48
タイトル マルチオミクスゲノムブラウザiMETHYLの紹介
発表者 〇小巻翔平1)、志波優1), 2)、古川亮平1), 3)、八谷剛史1)、大桃秀樹1)、 須藤洋一1)、大友亮1)、
佐々木真理1)、清水厚志1)
所 属 1)岩手医科大学 いわて東北メディカル・メガバンク機構 2)東京農業大学 生命科学部 3)慶應義塾大学 文学部
要 旨  我々が開発したiMETHYLは、日本人約100名の血液細胞のDNAメチル化率、遺伝子発現量のデータを1塩基多型頻度と統合し、誰でも自由に閲覧可能にしたマルチオミックスゲノムブラウザである。おもにCD4陽性Tリンパ球、単球、好中球からwhole-genome bisulfite sequencing(WGBS)、whole-genome sequencing、whole-transcriptome sequencingにより取得したデータに基づいており、各CpGサイト、SNP、遺伝子の平均メチル化率やアリル頻度、発現量の平均値などの統計値を閲覧できる。また2018年3月にはCD4陽性Tリンパ球、単球、好中球のマルチオミックスデータを用いたexpression Quantitative Trait Locus(eQTL)、methylation QTL(mQTL)、expression Quantitative Trait Methylation(eQTM)解析の結果、および20名分の好中球、単球、CD4陽性Tリンパ球、CD8陽性Tリンパ球、B細胞、NK細胞、PBMC、白血球のWGBSによるDNAメチル化データを追加した。本発表では、iMETHYLに掲載されているマルチオミックスデータおよびオミックス間の関連解析の概要や閲覧方法について紹介する。
番 号 49
タイトル SHOGoiN:1細胞解析に有効なヒト細胞情報データベース
発表者 〇陳影、山根順子、小櫻裕司、高橋弘樹、藤渕航
所 属 京都大学 iPS細胞研究所
要 旨  近年、細胞の状態を1細胞レベルで詳細に調べるsingle-cellオミックス解析が進んでいるが、それらの情報を統合して有効活用することにより各細胞が機能決定されるまでの道筋の解明、延いては生命現象の解明に繋がるため、医療分野の発展に大きく貢献すると考えられる。
 そこで我々は細胞の詳細な情報を統合して活用するためのデータベースSHOGoiNを構築し、ヒト細胞情報の網羅的な収集・格納を行っている。SHOGoiNでは、解剖学的位置、分化能、胚葉情報、体内に存在する時期、細胞種による細胞分類情報を格納しており、その結果、ヒト細胞種延べ約3,500種に分類された。また、その他single-cellオミックス解析情報、マーカー情報、細胞転換情報、細胞・組織画像などの多数の情報に加え、細胞情報解析用のツールを格納・搭載している。現在NIHが主導し1細胞レベルでヒト構成細胞を決定付ける国際プロジェクトHuman Cell Atlas が進められているが、SHOGoiNはこのプロジェクトからも特筆されている。
 将来的にはこれらの情報を統合的に有効活用することによって、創薬毒性予測や再生医療にも適用可能なデータベースとなることが期待できる。
番 号 50
タイトル SCPortalen:一細胞データ再利用のためのデータベース
発表者 Imad Abugessaisa、野口修平、長谷川哲、Melissa Cardon、〇粕川雄也
所 属 理化学研究所 生命医科学研究センター
要 旨  一細胞レベルでの遺伝子発現プロファイルをゲノムワイドに取得する技術の劇的な向上により、様々な細胞種の一細胞レベルでの遺伝子発現プロファイルデータが取得され、公共リポジトリ等で公開されている。これらのデータは取得した研究グループでの利用だけにとどまらず、その細胞を対象とした他の研究グループでの再利用も期待される。しかしながら、実験・データ解析手法の差異や、サンプル情報や実験条件などのいわゆる「メタデータ」の不足により、データの再利用には大きなハードルが存在する。そこで我々のグループでは、公開された一細胞遺伝子発現プロ ファイルのメタデータを補正し、統一したデータ解析法を適用した結果をまとめたデータベースを作成し、公開している。本発表では、このSCPortalenデータベースについて紹介する。
http://single-cell.clst.riken.jp/
Abugessaisa, I et al., NAR (2018), https://doi.org/10.1093/nar/gkx949
番 号 51
タイトル The FANTOM web resource, update 2018
発表者 〇野口修平、Marina Lizio、Imad Abugessaisa、Jessica Severin、粕川雄也、川路英哉
所 属 理化学研究所 生命医科学研究センター
要 旨  哺乳類ゲノムの機能アノテーションを目的とした国際共同研究FANTOM(Functional ANnoTation Of Mammalian Genome)プロジェクトの第五回目であるFANTOM5では、ヒトやマウスなどの様々な初代培養細胞や臓器、細胞株、時系列サンプルより構成される約3,000サンプルを対象に、転写開始の頻度を一塩基単位でゲノムワイドに測定した。本測定データを元にヒトゲノムの機能領域として重要な役割を果たすプロモーター、エンハンサー、そして非コードRNAのアトラス(地図)を作成し、得られたデータや解析結果についてはデータアーカイブ、そして複数のデータベースに格納され、多様な側面からの利用に供されている(http://fantom.gsc.riken.jp/5/)。
 今回のアップデートではdog、rat、chicken、macaqueのCAGE(Cap Analysis of Gene Expression)データ、および、それを用いた解析により同定したプロモーター領域のデータを追加した。これらのデータはFANTOM5のヒトやマウスのデータと同様に利用可能である。
番 号 52
タイトル SSBD:細胞・発生画像情報と生命動態情報の統合データベース
発表者 〇京田耕司1)、遠里由佳子1), 2)、ホーケネス1)、糸賀裕弥1)、大浪修一1)
所 属 1)理化学研究所 生命機能科学研究センター 2)大阪電気通信大学 情報通信工学部
要 旨  SSBD(Systems Science of Biological Dynamicsデータベース)は、生細胞イメージングにより得られる生命現象に対する画像データや画像処理により得られる定量データを共有するデータベースである(Tohsato et al. 2016; http://ssbd.qbic.riken.jp)。現在、多種多様な生命現象に対する610セットの画像データ、480セットの定量データを公開している。画像データはオリジナルフォーマット、定量データは我々が開発した統合フォーマットBDML/BD5で提供しており(Kyoda et al. 2015)、加えてREST APIによる両データへのアクセスも可能である。昨年度より、細胞・発生生物学分野のデータの統合を目指し、日本細胞生物学会、日本発生生物学会およびABiSとの連携を開始した。また、国際的なデータ共有の仕組みを構築するために、英国のOMEプロジェクトや欧州のEuro-bioimagingプロジェクトとの連携を開始した。本年度より、画像・定量データから統計解析等により得られる解析結果を共有するシステムを開発している。
番 号 53
タイトル 糖鎖科学ポータルGlyCosmos Portalの開発
発表者 〇塩田正明1)、小野多美子1)、細田正恵1)、土屋伸一郎1)、クオカ・ズカ1)、李宣明1)、 三浦信明2)、
平木愛子2)、渡辺由3)、安形清彦4)、藤田典昭4)、鈴木芳典4)、新町大輔5)、 青木ポール信行5)、金進東6)、
奥田修二郎3)、成松久4)、山田一作2)、木下聖子1)
所 属 1)創価大学 2)野口研究所 3)新潟大学 4)グライコバイオマーカー・リーディング・イノベーション株式会社 
5)合同会社SparqLite 6)情報・システム研究機構 ライフサイエンス統合データベースセンター
要 旨  GlyCosmos Portalは、リポジトリとデータベースを兼ね備える糖鎖科学ポータルである。糖鎖、複合糖質(糖タンパク質、糖脂質)、糖鎖関連遺伝子など糖鎖に関するあらゆる情報を統合した上で、ユーザーフレンドリーなインターフェースによって糖鎖について素早く調べられるポータルサイトの開発を目的としている。その実現のために、糖鎖構造表記法WURCS、糖鎖オントロジーGlycoRDFに加え新規に複合糖質オントロジーGlycoCoOを開発している。また、我々の開発してきた国際糖鎖構造リポジトリGlyTouCan、複合糖質リポジトリGlyComb、グライコプロテオミクスデータリポジトリGlycoPOSTを合わせて開発し、ACGG-DB、GlycoNAVI、Reactome、UniProt、UniCarbKBなど世界中の既存データベースとの連携によって開発したリポジトリを活用する。複合糖質や糖鎖関連遺伝子の関わるパスウェイについても可視化ツールを開発し糖鎖の位置付けを明確にできるシステムとする。
 ポスター発表では、GlyCosmos Portalの紹介および、開発の進捗状況を報告する。
番 号 54
タイトル Total Glycome Databaseの構築
発表者 〇三浦信明1)、古川潤一2)、花松久寿2)、朴錦花2)、岡田和恵2)、篠原康郎3)、木下聖子4)、山田一作1)
所 属 1)野口研究所 2)北海道大学 大学院医学研究院 3)金城学院大学 薬学部 4)創価大学 理工学部
要 旨  糖鎖は、生体内で細胞認識やシグナル伝達、糖タンパク質の局在情報やフォールディングのアシスト、品質管理など様々な情報を制御している翻訳語修飾の主役である。早くから疾患との関連で生体サンプルにおける糖鎖の発現量の研究は盛んに行われてきた。近年、生体内のN-結合型、O-結合型、糖脂質糖鎖、グリコサミノグリカン、遊離糖鎖というほぼ全ての糖鎖を網羅的に解析する方法が開発され、Total Glycome[1]という分野が確立されつつある。Total Glycomeでは従来単独の糖鎖が疾患の鍵となると考えて行われていた研究を100を超える糖鎖の発現パターン として認識することによって疾患の原因としてより多くの情報を得られる。
 関与する糖鎖が多いことは分析についても手間と困難が生じることが容易に予想される。本研究では、Total Glycomeで得られる糖鎖発現情報をデータベース化することでこの点において良いツールを提供できる土台を構築することを目指している。本発表では、その進捗状況とプロトタイプについて報告する。
[1]Kagaku to Seibutsu 53(9): 586-592 (2015)
番 号 55
タイトル WURCS:曖昧表記を可能とする糖鎖構造の一意的な表現の研究
発表者 〇三浦信明1)、木下聖子2)、山田一作1)
所 属 1)野口研究所 2)創価大学 理工学部
要 旨  糖鎖研究ではデータベースの活用について構造情報の取り扱いなどの困難がある。我々は国際糖鎖構造リポジトリGlyTouCan[1]を基軸としてこの問題に取り組んでいる。全ての糖鎖構造に一意のIDを与えることによって全世界のデータベースの横断的な検索を目指し構造表記法WURCS[2]の開発をすすめている。
 糖鎖構造においてはα-、β-などの立体情報、結合位置の自由度、分岐などが複雑に絡み合うためあいまいな糖鎖構造の一意な定義が難しい。現状では一部の“or”表現のみを実現している。そこで本研究ではこれを拡張し、より様々な曖昧表記を実現することを目標としている。本発表では、その進捗状況とともにWURCSを動作させるための基盤となるソフトウェアであるWURCSFrameworkの現状を報告する。
[1] Tiemeyer M et al., Glycobiology, 27, 915-19 (2017)
[2] Matsubara M et al., J Chem Inf Model., 57, 632-37 (2017)
番 号 56
タイトル GlycoNAVI:疾患と複合糖質の糖鎖量比変化データベースの構築
発表者 〇平木愛子1)、三浦信明1)、木下聖子2)、山田一作1)
所 属 1)野口研究所 2)創価大学 理工学部
要 旨  糖鎖は翻訳後修飾で重要な役割を果たしており、糖鎖付加されるタンパク質や脂質の生成、局在、寿命を制御しているほか、シグナル伝達など生命を維持するための「情報」も司っている。疾患患者らのタンパク質ではこの修飾バランスが崩れ、糖鎖発現量が変化することが報告されている。我々のグループでは、疾患に関連する複合糖質(糖タンパク質及び糖脂質)糖鎖のデータベースを構築することによって、疾患糖鎖生物学のサポートツールを開発している。
 複合糖質の糖鎖修飾位置、糖鎖構造、存在比、関連する疾患(疾患名、DOID、ステージ)、サンプル情報(生物種、細胞/組織種、性別、年齢など)といったデータを論文より抽出し、複合糖質オントロジーGlycoCoOなどを利用してRDF化している。本発表では、進捗と他データベースとの連携について議論したい。
番 号 57
タイトル GlyComb:複合糖質リポジトリの開発
発表者 〇新町大輔1)、青木ポール信行1)、塩田正明2)、渡辺由3)、奥田修二郎3)、山田一作4)、木下聖子2)
所 属 1)合同会社SparqLite 2)創価大学 理工学部 3)新潟大学 大学院歯学総合研究科 4)野口研究所
要 旨  2014年より糖鎖構造の国際リポジトリであるGlyTouCanの開発を行なってきた[PMID: 26476458]。開発以降これまで10万件を超える糖鎖構造が登録された。そして、近年、糖鎖研究だけでなく、糖タンパク質などの複合糖質の解析技術の発展により、複合糖質のデータが生産され始め、UniCarbKB、GlyConnectといった糖タンパク質を扱ったデータベースが開発されてきている。しかし、複合糖質を登録し、参照できるリポジトリは存在せず、複合糖質リポジトリの必要性が増してきた。そこで、我々は、糖タンパク質、糖脂質といった複合糖質構造に対してアクセッ ション番号を割り当てるリポジトリシステムとしてGlyCombの開発を行なった。糖タンパク質/糖脂質、糖鎖修飾位置、糖鎖構造の3項目を入力とし、具体的には、UniProt ID/LIPID MAPS ID、糖鎖修飾位置、GlyTouCanのアクセッション番号を利用して複合糖質を登録するシステムを構築している。また、GlyCombは、GlyTouCanで活用されているRDF/SPARQLを利用し、データ管理を行なっている。今回の発表では、GlyCombの概要と開発について報告する。
番 号 58
タイトル MicrobeDB.jp ポータル:統合微生物データベースのポータルサイト構築
発表者 〇藤澤貴智1)、森宙史1)、谷澤靖洋1)、神沼英里1)、内山郁夫2)、山田拓司3)、高橋弘喜4)、中村保一1)、
黒川顕1)
所 属 1)情報・システム研究機構 国立遺伝学研究所生命情報研究センター 
2)自然科学研究機構 基礎生物学研究所理論生物学領域 3)東京工業大学 4)千葉大学 真菌医学研究センター
要 旨  我々は、微生物に関するデータを系統・遺伝子・環境の3つの軸に沿って整理・統合した統合微生物データベースMicrobeDB.jp(http://microbedb.jp/)を公開している。現在、公開されている約17万サンプルのメタゲノムデータ、約1万7千株のゲノム・ドラフトゲノムデータを収録し、微生物のゲノムやメタゲノム情報を容易に利活用するために継続的な開発を行っている。収録データについては、微生物ゲノム情報を記述するためのオントロジーを整備し、RDF形式でデータセットを記述し、さらには、解析プロトコルの標準化および解析パイプラインの開発および連携を実施してきた。本発表では、データベースのユーザビリティ向上を目的として、ユーザインターフェース改良とユーザのゲノム・メタゲノムを解析するためのレポジトリ機能を統合したMicrobeDB.jpポータルサイトを構築した。また、環境情報、宿主生物、温度、pHなどのメタデータによるファセット検索から解析済みのメタゲノム解析データを比較する機能の提供を開始した。さらに、データ更新に関わるサンプルメタデータ記述RDFの更新および メタデータのキュレーションについても発表する。
番 号 59
タイトル MicrobeDB.jpのメタゲノム解析パイプライン
発表者 〇森宙史、黒川顕
所 属 情報・システム研究機構 国立遺伝学研究所生命情報研究センター
要 旨  培養が困難な微生物を多数含む微生物群集の系統組成や遺伝子機能組成を明らかにするために、メタゲノム解析やメタ16S解析が盛んに行われている。それらのシーケンシング結果は公共の塩基配列データベースに大量に蓄積されているが、シーケンサー由来のリードデータと付随するサンプリング環境等のメタデータのみ登録される場合がほとんどであり、各サンプルの系統組成や遺伝子機能組成の情報を得るためには、配列データをダウンロード後に再解析する必要がある。MicrobeDB.jpでは、ゲノム情報と微生物の生息環境の情報を統合化するために、それらメタゲノム・メタ16S解析の配列データを同一の解析パイプラインで再解析し、サンプルごとに系統組成や遺伝子機能組成、サンプルのメタデータをRDF化している。しかしながら、公共の塩基配列データベース中のメタゲノム・メタ16S解析の配列データは爆発的な勢いで増加しており、すでに100万サンプルを超えている。これらの配列データを高速かつ高精度に解析するために、解析パイプラインもMicrobeDB.jpのバージョンアップの度に使うソフトウェア等を更新している。本発表では、現在MicrobeDB.jpで用いているメタゲノム・メタ16S解析パイプラインについて発表する。
番 号 60
タイトル 微生物群集構造データの潜在環境因子の予測・可視化ツールLEA
発表者 〇東光一1)、鈴木真也2)、黒澤晋2)、森宙史1)、黒川顕1)
所 属 1)情報・システム研究機構 国立遺伝学研究所生命情報研究センター 2)東京工業大学 生命理工学院
要 旨  近年、世界中の様々な自然環境から膨大な数のサンプルが取得され、それらの微生物群集構造データが爆発的な勢いで蓄積されている。微生物群集構造を扱う研究の多くは、離散的な環境カテゴリを各サンプルに割り当てることで、特定の環境で観察される群集の特徴や、環境間の群集構造の差異を明らかにすることを目的としている。しかし実際の環境は多くの場合明確な境界の定義が難しく、群集構造の変化は環境の時空間的な連続性に基づいて評価する必要がある。本研究では、微生物群集構造と、由来環境に関する自然言語記述文書が対となった3万以上のサンプルを含むデータセットに統計的潜在意味解析(トピックモデル)を適用することにより、そのような環境の連続性を抽出することを試みた。抽出された潜在変数(トピック)は、共起微生物と共起単語セットとの対応関係を表し、群集構造と文書の両方に影響を与える潜在的な環境因子と解釈できる。サンプルは複数トピックの混合として表現されるため、トピックに基づく全サンプルの類似性の可視化により、多様な環境の連続性を評価できる。モデルの学習結果を利用して、膨大な数のサンプルを探索するウェブアプリケーションLEAを開発した。新たに取得したサンプルの微生物群集構造データをアップロードすることで、LEAはサンプルの由来環境を高速に予測し、新規サンプルの群集構造の典型性・異質性を評価することも可能である。
番 号 61
タイトル 配列データおよび反応データベースを用いた微生物代謝モデルの 自動構築・ツールについて
発表者 〇厨祐喜1)、大山彰2)、荒木通啓1), 3)
所 属 1)神戸大学 大学院科学技術イノベーション研究科 2)インシリコバイオロジー株式会社 
3)京都大学 大学院医学研究科
要 旨  様々な微生物による種々の有用物質の生産が広範に研究されており、このような有用物質の生産に、代謝モデルを用いたFlux balance analysis(FBA)などによるin silicoでの解析・設計が有用なことが示唆されている。また、次世代シーケンサーにより、種々の生物の配列がハイスループットに取得され集積されるようになっている。そのため、よく研究がなされているモデル生物以外の非モデル生物、例えば新規な有用物質を生産する微生物などでも代謝解析、有用物質生産の改善のために代謝モデルの構築が必要されている。これまでにも配列データや反応データベースを利用した代謝モデルの自動構築ツールは開発されているが、最近発表された代謝モデルでもこれらのツールはあまり使われておらず、人の手による部分が多いのが現状である。そこで本研究では、より使われやすい代謝モデルの自動構築ツールの開発とそれによる微生物の代謝モデルの構築を目指している。今回は、これまでに構築した主要な宿主である大腸菌、コリネ型細菌、放線菌、それぞれ1株についての代謝モデルと開発中のツールの現状、今後の課題などについて述べる。
番 号 62
タイトル 健全にする生態システム制御機能(湖沼池の免疫)の扉を開く鍵
発表者 長正一郎
所 属 有限会社アクアラボ
要 旨  湖沼池の藻類汚濁を健全に改善する生態システム制御機能させる、鍵の紙を分解するセルロース分解酵素を持つ菌類が堆積層にいる、その仲間の菌類群集の産する酵素に含まれるブドウ糖(グルコース)が活動源(エネルギー創出)となって、一旦細菌 群集や原生生物各種が増殖した後休眠胞子なるか枯死して沈降して堆積層に摂取したリンを閉じ込める、リンは窒素や炭素と違って大気と交換しない性質でリンを制限して抑制する、鍵が健全にする生態システム制御機能(湖沼池の免疫・生態系機能)の扉を開き、 藻類汚濁の抑制現象に導く。
 これらの常時観測は、水温と溶存酸素(DO)は水質計測計器の飽和溶存酸素(Saturated DO)を算出機能付きでDOとSaturated DOの差を得て生態系生物圏を、同時にフローイングインジェクションとイオンクロマトで水質を、ITで観測値収集AIで生態系機能様式の蓄積と情報活用(データベース)する。
 合わせて随時観測として、生態系生物圏の変化とらえる、フローサイトメトリーの形態別定量と次世代シーケンス遺伝子解析の種の同定と定量の計測と検定の情報により、ITで観測値収集AIで生態系機能様式の蓄積を情報化(データベース)する。
 生態系機能蓄積情報(データベース)とする。
参考HP http://researchmap.jp/chou
参考文献 用水と廃水 Vol.60 No.9 603~610 2018
番 号 63
タイトル 微生物の安全な利用に向けたNITEの情報提供の取り組み
発表者 〇黄地祥子、藤田真澄、桑田祐輔、木村明音、牧山葉子、山本美佳、 北橋優子、宮澤せいは、市川夏子、川﨑浩子、
加藤愼一郎
所 属 製品評価技術基盤機構 バイオテクノロジーセンター
要 旨  NITEバイオテクノロジーセンターでは、微生物の安全かつ適切な利用の支援を目的として、2つのデータベース 「微生物有害情報リスト(平成26年公開)(https://www.nite.go.jp/nbrc/list/risk/)」と「MiFuP Safety(平成29年公開)(http://www.bio.nite.go.jp/mifup_safety/)」を公開している。
「微生物有害情報リスト」は、微生物(細菌、真菌)の危険度/有害性の判断基準となる国内外の情報を一元化したものであり、各微生物のバイオセーフティーレベル(BSL)分類や国内法規制の適用の有無などの情報を、学名(旧名、異名を含む)から検索することが可能である。
 一方、「MiFuP Safety」は、微生物(細菌)のゲノム情報から有害性機能に関わる遺伝子を検出し、微生物の有害性機能(毒素産生能、薬剤耐性等)を推定するデータベースである。本DBには、有害性機能に関与する遺伝子の組合せの情報及びそれら遺伝子のオーソログの検出条件(配列相同性やモチーフ・ドメインの有無)が搭載されており、ユーザーのゲノム配列情報(塩基配列又はアミノ酸配列)から有害性機能の発揮に必要な遺伝子を自動検出し、有害性機能を推定することが可能である。
 本発表では両データベースの概要と共に、今後開発を予定している、両データベースの統合サイトについて紹介する。

ポスター発表参加者募集!(受付終了)

 シンポジウムの一環として、ポスター発表を開催します。生命科学分野のデータベースを様々な形で研究に利活用しているユーザの方々、生命科学分野に限らずデータベースの開発や運用に携わる方々にご発表いただき、シンポジウム参加者とデータベースについて幅広く議論していただければと考え、ポスター発表参加者を下記募集要領のとおり広く募集いたします。特に、ユーザから活用例をご紹介いただくことは、データベースの利活用を促進し、また、今後のデータベースの開発・運用にとっても大変参考になると考えます。多くの方からの応募をお待ちしています。

ポスター発表募集要領

内容例 : 1次データベースの構築・運用
      複数のデータベース組み合わせ等の2次データベースの構築・運用
      データベースを利用したツール開発(解析、可視化等)
      データベース利用による研究の効率化
応募締切: 2018年7月20日(金)12:00まで
応募方法: 受付は終了しました。
      以下必要事項について留意事項を確認の上、申込フォームからお申し込み下さい。
      発表タイトル
      発表要旨(参考文献も含め500文字程度)
      発表者(連名者含む)情報
留意事項: ・展示スペースに限りがあるため、応募者多数の場合は選考を実施いたします。
       採択の可否については、7月末日までに発表者のメールアドレス宛に連絡いたします。
      ・ご応募の中から、口頭発表(15分程度)をお願いすることがあります。こちらも7月末日までに連絡いたします。
      ・ポスターセッションは午後に予定しております(45分程度)。
      ・ポスターセッションの直前に、ライトニングトーク(1ポスター1分での簡単な発表内容の紹介)を実施いたします。
       なお、ライトニングトークの様子は、当日インターネットでライブ配信する予定です。
      ・ポスター発表の氏名・所属・タイトルおよび要旨は、事前にシンポジウムウェブサイトから公開するほか、
       要旨集として当日配布する予定です。
      ・当日発表いただいたポスターは、後日データを提出いただき、PDFを同サイトから公開する予定です。
       なお、ポスターには、DOI*1を付与します。また、データベース統合化の趣旨に鑑みて、
       公開に際してのライセンスの扱いはCC-BY*2とし、公開サイトにその旨を記載する予定です。

*1 DOIは、Digital Object Identifierの略で、デジタルコンテンツに付与される国際的な識別子です。DOIは容易にURLに変換することができます。このURLは、コンテンツ本来のURLにリダイレクトされます。一度登録されたDOIは変更されません。このため、コンテンツ自体のURLが変更されても、コンテンツのDOIを知っていればリンク切れすることなくアクセスすることができます。詳細は、日本で唯一のDOI登録機関であるジャパンリンクセンターのウェブサイトをご参照ください。
*2 CC-BYは、国際的非営利組織クリエイティブ・コモンズが提唱するライセンス形態のひとつで、「クレジットを表示すること」を条件に著作物の利用を許可するというものです。詳細は、クリエイティブ・コモンズ・ジャパンの解説サイトをご参照ください。