ライフサイエンス分野のデータ利活用基盤「バイオバンク」

2018/12/13

 

 

バイオサイエンス部 バイオサイエンス室

AI/機械学習、IoTの導入やクラウドの普及と共に、さまざまな業界でビッグデータを活用し、ビジネスの革新や社会インフラの高度化につなげようとする動きが加速しています。ライフサイエンス分野においても、分析装置やITの技術進展と普及に伴い、網羅的に生体分子データを取得し、そこから新たな知見を見出すデータ駆動型研究が加速しています。


この様な研究を支える重要な基盤の1つに、数千~数十万人規模の生体試料とそれに付随する健康情報や臨床情報、各種生体分子データ等様々な情報を、高品質かつ効率的に収集、管理、分配する「バイオバンク」があります。

 

 

バイオバンクは、研究目的によって「住民準拠型バイオバンク(Population-based Biobank)」と「疾患指向型バイオバンク(Disease-oriented Biobank)」の2つに大きく分けられます。


前者は、先制医療や予防医学を最終目的として、がんや心疾患、脳卒中、糖尿病といった生活習慣病の発症、進行に関連する遺伝的要因、環境的要因を調べる研究に用いられます。周辺住民数万~数十万人に対してリクルートを行い、研究参加の同意を得られた住民から、血液や唾液などの生体試料の採取と、健診や生活環境・習慣に関するアンケートを実施し、ベースライン情報を取得します。その後、追跡調査として参加者に対して定期的な健診や追加アンケートを実施したり、採取した試料からゲノムデータやタンパク質や代謝物の網羅的データを取得することにより、付加価値の高いデータにしていきます。
この方法は、先制医療や予防医学を推進する上で最適な研究デザインとされていますが、ある疾患の発症に着目した場合、統計的に十分なN数を確保するには数万~数10万人規模の集団を登録する必要があり、また、登録時に健常であった住民が、生活習慣病を発症し、進行する過程を調べるため、追跡調査は数年から長いものでは十数年にわたります。そのため、成果が得られるまでには大変な労力と時間がかかり、多額の資金と忍耐を要する事業となります。
代表的なバイオバンクとして、英国の中高年50万人のデータを登録しているUK Biobankや、100万人の登録を目指している米国のAll of US、三世代の家族を含む16万人のデータを登録しているオランダのLifelinesが挙げられます。
日本では、2005年に開始し長浜市住民1万人を追跡調査しているながはま0次予防コホート事業や、東日本大震災被災地の復興に取り組むために2012年に設立され、15万人の登録を達成した東北メディカル・メガバンク事業があります。


一方、後者の疾患バイオバンクは、疾患発症メカニズムの解明や、治療・診断法の開発を目的として、研究参加の同意が得られた患者の生体試料と臨床情報を収集・保管するバイオバンクで、クリニカルバイオバンクとも呼ばれます。バイオバンクの施設が病院に併設されていることが多く、臨床情報と直結した試料を確保することができるといったメリットがあります。特定の疾患に罹患した患者のデータを収集するため、住民バイオバンクよりも小規模で成果も比較的早く得ることができ、時間やコストを節約できます。有病率が非常に小さな疾患にも有効な方法となります。しかしながら、集団の選択に偏りが生じる「選択バイアス」や、疾患が発症した後に情報を収集するため、「思い出しバイアス」が混入しやすいといった課題も存在します。
疾患バイオバンクは小規模なものから大規模なものまで世界中に多数存在していますが、代表的なものとして、がんと希少疾患を対象とした英国の100,000 Genomes Project、がんを対象とした米国のCancer Moonshot、フィンランドのHelsinki BiobankやAuria Biobankが挙げられます。
日本では、6疾患領域を対象としたナショナルセンター・バイオバンクネットワーク、がんを対象とした京大病院キャンサーバイオバンクや静岡県立がんセンタープロジェクトHOPEなどがあります。 

 

 

このように、バイオバンクは疾患・健康長寿メカニズムの新規解明や、革新的な治療法、診断法につながる重要な基盤となりますが、バイオバンクの運営者やバイオバンクを利用する研究者だけでなく、一般市民の理解と協力なくしては成り立ちません。バイオバンクの取組みがいち早く始まり、浸透している欧州諸国では、バイオバンクがもたらす公共の利益について国民の理解が進んでおり、研究成果に対しても高い期待が持たれています。日本においても、バイオバンクという概念が国民に浸透し、多くの理解や関心がもたれ、より有益なバイオバンク活動が展開されることを期待しています。

 

当社のバイオサイエンス事業では、バイオバンクに登録されている大量の生体分子情報に対し、統計解析手法や機械学習、AIを適用させ、データマイニングを行い、お客様の研究を加速しています。今後ますますデータの種類・量が増え、またより一層深い解析も同時に求められることが予想されますが、基礎的なデータ分析力に裏打ちされた圧倒的な付加価値を目指していきたいと思います。 

執筆者

お問い合わせ

ページTOP