HOME > REPORT COLUMN > コラム > 過去のメルマガ > ビッグデータはイノベーションを起こすのか?~動かないデータと動くデータのイノベーション~

ビッグデータはイノベーションを起こすのか?~動かないデータと動くデータのイノベーション~

最近、様々な場所でリアルアワールドデータの活用という言葉が、多く使われるようになっています。リアルワールドデータ(RWD)とは、臨床現場から得られる匿名のパーソナルデータの事を言います。簡単に言うと電子カルテのデータやレセプトデータなどがそれにあたります。これにより、患者属性や、治療履歴、服薬履歴、医療費などさまざまなデータがわかります。そのデータを用いて新薬開発の効率化や、有害事象のリスク排除などに役立てようというわけです。2016年に厚生省がレセプトデータベースを公開したり、国を挙げてRWDの活用が活発化している背景があります。
http://www.jpma.or.jp/medicine/shinyaku/tiken/allotment/rwd2.html

こういった、医療にかかわるビックデータの活用は、他にもあります。日本初の産学連携全国がんゲノムスクリーニングプロジェクト「SCRUM-Japan」という遺伝子治療の基盤プロジェクトがあります。SCRUM-Japanの目的は

  • 大規模な遺伝子異常のスクリーニングにより、希少頻度の遺伝子異常をもつがん患者さんを見つけ出し、遺伝子解析の結果に基づいた有効な治療薬を届けること

  • 複数の遺伝子異常が同時に検出できるマルチプレックス診断薬を臨床応用すること

この事で、がん治療に大きな進歩をもたらすのではと期待されています。医療分野におけるビッグデータの活用は、今後も益々加速していくことでしょう。
http://www.scrum-japan.ncc.go.jp/

最近GoogleがFitBitを買ったニュースが流れました。

https://www.itmedia.co.jp/news/articles/1911/01/news154.html

GAFAのヘルスケア領域での、ビックデータを使ったイノベーションも加速しています。昨年末にAPPLEウォッチによる大規模な臨床研究が話題となりました、人々のログデータについての価値が次のステージに入ってきました。

さてこれらビックデータはどのようにイノベーションにつながるのでしょうか?

t-SNEという機械学習による次元圧縮による可視化手法があります。
https://mark-borg.github.io/blog/2016/tsne-ml/

この解析は、元々NGS(次世代シーケンサー)の普及に伴い開かれたシングルセルゲノミクスという分子生物学の分野で開発されたそうです(ここは、間違ってたすみません)。これにより、人が勝手に免疫細胞をB細胞やらT細胞やらNK細胞と分類していたものが本当は細胞一つ一つに個性があることがわかったのだそうです。

t-SNEのクラスタリングにおいて、AIがどのような基準でクラスタリングしているのかは、誰にもわかりません。いわゆるブラックボックスというやつです。それでも、無数に有名絵画の画像データを入れただけで印象派やキュビズムなどの作風を正確にクラスタリングします。

こういったかつてない多量の情報と新たな分析手法は、人類がまだ見ぬ景色を見せてくれます。それは、思ってもみなかったものになりそうです。

私見ですが、これらデータは2種類に大別されると考えています。
動かないデータ動くデータです。
動かないデータは、その方のプロフィールやLIVINGWILLなどの記録しておくデータ(もちろん更新することでデータは変化しますが)。
動くデータはログデータです、毎分毎秒毎のデータ、位置情報や心拍、食事ログなども重要なデータとなると思います。これらのデータ分析により人の健康は家とコンビニの距離に関係してるとか、ある食材を選び出すとうつのリスクが高まるなどがわかり、この人には、予防的介入をしようという判断が可能となるかもしれません。

動かないデータは、今後公的な機関がどんどんデータベースを作成して公開していくかと思います。よってイノベーションの鍵は、どれだけ希少な動くデータを保持するか、それを美しく解析できるかにかかっているかもしれません。

文責 國井 誠

TOP