東北大学東北メディカル・メガバンク機構、個別化医療・個別化予防の実現に向け、 東日本大震災の被災地を含む住民約15万人のゲノム解析などを行うスーパーコンピュータシステムの本格運用を開始

2014.07.23

国立大学法人東北大学東北メディカル・メガバンク機構(以下、ToMMo*1)は、7月23日(水)、東日本大震災の被災地を含む宮城県および岩手県の住民約15万人から提供されるゲノム*2の解析などを行うスーパーコンピュータシステム「大規模ゲノムコホート解析システム」を、7月から本格的に運用開始した。

ToMMoは、学校法人岩手医科大学と共同で進める東日本大震災の被災地の復興支援事業である「東北メディカル・メガバンク計画」の一環として、本システムを活用し、被災地住民の一人ひとりの特性に合わせた疾患の治療や予防を行う、個別化医療および予防の実現をめざす。
また、本システムを活用し、被災地を含む宮城県および岩手県の住民を対象とする大規模なコホート調査*3を通じて提供されるゲノムを対象に解析を行う。
具体的には、数千人規模の全ゲノム配列*4の解析を行い、その結果から日本人の標準的なゲノム配列のデータベースを構築する。さらに、標準的なゲノム配列と一人ひとりのゲノム配列を比較することでゲノムの違いを検出し、個々の診療情報などを組み合わせて、ゲノムの違いと疾患原因との関係性を統計的に解析。将来的には、さまざまな解析手法も検討し、約15万人分のゲノム解析を進めていく。
さらに、ゲノムの解析結果や住民から提供される血液などの生体試料、生活習慣や居住環境、病歴などに関する調査結果、生化学検査*5結果、MRI画像などの多様なデータを保管するバイオバンクの基盤としても本システムを活用する。
住民から提供されるゲノムや生体試料などの情報は、ToMMoにおいて、研究者やシステム運用者などによって個人の特定が不可能なように匿名化される。さらに、生体認証を含めた複数の認証システムでアクセス管理を行うなど、厳格な個人情報管理のもと保管、運用される。

本システムは、(株)日立製作所が、これまでライフサイエンス分野におけるスーパーコンピュータシステムの構築、運用で培ったノウハウを結集し、構築したもの。
サーバは16,480個の高性能CPUコアを搭載し、ゲノム分野に特化したスーパーコンピュータシステムとしては国内トップクラス*6となる、401TFLOPS*7の総合理論演算性能*8を実現している。また、膨大なデータを格納できるよう、12.3PB*9の大容量なストレージを備えており、最大50PBまで容量を拡張可能。さらに、バックアップ装置を導入し、データ喪失の防止を図っている。加えて、環境に配慮したシステム運用を実現するため、本システムを設置しているマシン室にCOP*10値が3以上の高効率空調機器を導入したほか、日立の空調環境コンサルティングサービス「AirAssist®(エアアシスト)」により、IT機器と空調機器の最適なレイアウト設計を行うなど、効率的な空調環境を実現し、消費電力の低減を図っている。

ToMMoは、東日本大震災の被災地における地域医療の再建と、大規模な医療情報化に対応した医療の構築などを目的として、2012年2月に設立。現在、宮城県および岩手県の住民を対象に、個別化医療および予防の実現をめざし、地域住民の協力のもと、約15万人を目標としたコホート調査を岩手医科大学と共同で実施しており、加えて各住民の生活習慣病やアレルギー性疾患などをはじめとする疾患への耐性や薬の効果などと、個々の遺伝的要因および環境的要因の関係性の解明などの研究を行っている。

本研究においては、将来的な個別化医療・個別化予防の実現のため、コホート調査に協力する住民から提供される血液などからゲノムを採取し、DNAシークエンサー*11を用いてゲノム配列データを取得して、大規模なゲノム配列の解析に取り組んでいる。
ToMMoは、1人あたり約3億本ものゲノム断片化配列*12をもとにしたゲノム解析を可能とし、さらに、多様なデータを保管するバイオバンクの基盤となる、高性能かつ大規模なスーパーコンピュータシステムを、日立の協力のもと、構築した。

*1 ToMMo:Tohoku Medical Megabank Organizationの略。
*2 ゲノム:生物の持つすべての遺伝情報の1セットのこと。
*3 コホート調査:多くの人々を対象にして、長期間にわたって健康追跡調査を行うことで、体質や生活習慣、環境と、疾病の関係性を明らかにする調査。「東北メディカル・メガバンク計画」では、宮城県と岩手県において、一般の住民を対象とした地域住民コホート調査と、同地域の妊婦とその家族を対象とした三世代コホート調査を実施している。
*4 ゲノム配列:各染色体を構成する塩基の配列で、遺伝情報を表す。
*5 生化学検査:血液を遠心分離器によって、赤血球、白血球、血小板などや血清に分離し、血液中の物質を化学的に分析することで、疾患の診断や治療の判定、疾患の経過観察に用いる検査。
*6 2014年7月23日現在、日立調べ。
*7 TFLOPS(テラフロップス):浮動小数点演算を1秒間に1兆回実行する能力。
*8 総合理論演算性能:同時に動作可能な全ての演算器が動作したときの理論上の性能。
*9 PB(ぺタバイト): 約1,000兆バイト。
*10 COP(Coefficient Of Performance):空調機器が作り出す熱・冷熱量の、空調機器が消費する電力量に対する割合を示す数値。COP値が3.0の空調機器は、消費する電力量の3倍の熱・冷熱量を作り出せる空調機器であることを意味し、COPの値が高いほど、省エネ性の高い空調機器といえる。
*11 DNAシークエンサー:化学処理したDNAサンプルに対してさまざまな分析処理を行うことで、ゲノムの塩基配列を自動的に読み取るための装置。
*12 ゲノム断片化配列:DNAシークエンサーから出力されるゲノム配列は、DNAシークエンサーが解析する単位ごとに断片化されたデータとして出力される。

●お問い合わせ
国立大学法人東北大学東北メディカル・メガバンク機構
ゲノム解析部門
教授 木下賢吾
TEL:022-795-7179
URL:http://www.sb.ecei.tohoku.ac.jp/