2020-11-10
国立大学法人東京医科歯科大学(注1,以下 東京医科歯科大学)と(株)富士通研究所(注2,以下 富士通研究所)は,2020年5月から2023年3月まで実施の文部科学省のスーパーコンピュータ「富岳」成果創出加速プログラム(注3)において,「大規模データ解析と人工知能技術によるがんの起源と多様性の解明」をテーマに,スーパーコンピュータ「富岳」(注4)上で,発がんに関連している可能性の高い遺伝子間の影響関係を表すネットワークの推定と富士通研究所の説明可能なAI技術「Deep Tensor(ディープ テンソル)」(注5)を用いたがんの浸潤や転移との関連を予測する計算を1日以内で実現した。
これまで,遺伝子データからがんの病態に関連する可能性の高い遺伝子の動作を表すネットワーク構造を抽出してがんの病態を予測する計算は,大学などで利用可能なスーパーコンピュータを用いても数カ月かかっていた。そのため,個々の遺伝子レベルではわからない新たながんのメカニズムを発見し,研究の中に取り入れることが困難であった。
今回,「富岳」を用いて,2万個の遺伝子データ解析から上皮性がん細胞における遺伝子間の影響関係を表すネットワークを抽出し,さらに富士通研究所の「Deep Tensor」を用いてがんの浸潤や転移との関連を予測し,その予測根拠を提示することができるようになった。
東京医科歯科大学と富士通研究所は,今後,がんの起源や多様性の獲得の解明に貢献するとともに,スーパーコンピュータ「富岳」の特色であるAI分野での活用を加速させ,産業競争力の強化へ貢献していく。
●背景
人体には数十兆個の細胞があり,生命のプログラムであるゲノムが格納されている。がんは,ゲノムに変異が入って異常を起こした極めて複雑な細胞の集まりで,最近の研究では,がんの種類を横断したがんゲノム解析により,変異同士が相乗的にがん化を促進するという新たな発がん機構が発見されており,こうしたがんがどのように発生し,多様性を獲得していくかを解明することは極めて重要な課題になっている。
東京医科歯科大学では,世界屈指のヘルスケア・サイエンス拠点の形成を目的に,医学・歯学に特化したデータサイエンスの基盤として,2020年4月にM&Dデータ科学センターを設立した。同センターの成果を臨床試験に応用し,展開するため,AIを活用した大量のデータから研究に有益な知見を生み出すしくみを確立することを目指している。
今回,東京医科歯科大学は富士通研究所と共同で,文部科学省のスーパーコンピュータ「富岳」成果創出加速プログラムにおいて,「大規模データ解析と人工知能技術によるがんの起源と多様性の解明」をテーマに,世界最先端のがん研究の成果創出に向け,最新の観測技術を用いて得られる詳細かつ網羅的な大量データを収集し,「富岳」上で高速シーケンス解析や人工知能技術を用いたネットワーク解析を進めている。その中で,富士通研究所の説明可能なAI 技術「Deep Tensor」を用いて,上皮性がん細胞における遺伝子間の影響関係を表すネットワーク構造の特徴の違いを人間の理解しやすい形で提示するなど,上皮性がんに関する10年以上に渡る研究でわかってきたがんの浸潤や転移に関する知見の全貌を,学術的な観点で一度に示すことができた。
●「富岳」成果創出加速プログラムにおける取り組みについて
東京医科歯科大学と富士通研究所は,2020年5月より,文部科学省が「富岳」を用いて成果を早期に創出することを目的としたスーパーコンピュータ「富岳」成果創出加速プログラムにおいて,19課題のひとつに選定された「大規模データ解析と人工知能技術によるがんの起源と多様性の解明」をテーマとする取り組みを進め,今回以下の成果を達成した。
・目的
がん細胞やがんに関係する遺伝子などの間の膨大なメカニズムをAIと「富岳」を用いて解析し,新たながんの治療法の確立に結びつく知見を引き出す。
・実施内容
がんのメカニズムの解明に向け,これまで行ってきたがんの種類別の遺伝子やそれらの変異探しに加え,多種のがん遺伝子と環境,年齢などの要因との関係を探ることが重要な課題となっている。そのために,個々の細胞解析や約1,000カ所にわたるマイクロメートル単位で生体採取した細胞のゲノムシーケンスデータ解析と,遺伝子間の影響関係を表すネットワークなどの説明可能なAI「Deep Tensor」を用いた解析により,新たながんの治療法の確立に結びつく知見を引き出す。これにより,正常な細胞組織から,どのように遺伝子変異クローンが生じるのか,遺伝子変異とその組み合わせがどのように細胞の形状を決定するのか,さらには,その多様性・複雑性のために研究が進んでいないゲノムの構造異常が発がんにどう関わるのかを解明する。
・役割
東京医科歯科大学:
1. 遺伝子データの収集・管理,医科と歯科の臨床に関わる課題設定
2. AIが提示した知見の解釈と実証
富士通研究所:
1. 「富岳」への説明可能なAI技術「Deep Tensor」の実装とネットワーク構造からの特徴の抽出
2. 大規模データ向けの「Deep Tensor」の高速化および知見の手がかりを引き出すための説明技術の向上
・今回の成果
生命科学研究において,これまで2万個の遺伝子間の影響関係を表すネットワークの推定の計算は,大学などで利用可能なスーパーコンピュータを独占的に用いても数カ月を要し,かつ独占的に用いること自体が現実的ではないため,実質的に不可能であった。
今回,遺伝子データの加工プロセスを「富岳」の高速処理に対応させ,さらに,高いメモリ性能を最大限に引き出す富士通研究所のソフトウェア高速化技術により「Deep Tensor」の処理速度を向上させた。これにより,発がんに関連する可能性の高い遺伝子間の影響関係を表すネットワークの推定とがんの浸潤や転移との関連の予測の計算を,「富岳」を用いて1日以内で完了させることに成功した。
●今後の展望
東京医科歯科大学と富士通研究所は,今回実現した「富岳」による高速シーケンス解析および説明可能なAI「Deep Tensor」を用いたネットワーク解析を,近年発見されたノンコーディングRNA(注6)と呼ばれる膨大な遺伝子情報を含めた観測データにも適用していく。そして,その解析結果を,説明可能なAIにより人が理解可能な形に翻訳することで,世界最先端のがん研究の成果を創出していく。
本研究は,文部科学省「富岳」成果創出加速プログラム「大規模データ解析と人工知能技術によるがんの起源と多様性の解明」の一環として実施されたもの。また,本研究の一部は,スーパーコンピュータ「富岳」の計算資源の提供を受け,実施した。
注1 東京医科歯科大学:所在地 東京都文京区,学長 田中雄二郎。
注2 株式会社富士通研究所:本社 神奈川県川崎市,代表取締役社長 原裕貴。
注3 スーパーコンピュータ「富岳」成果創出加速プログラム:「富岳」を用いた成果を早期に創出することを目的として文部科学省が設置したプログラム。
注4 スーパーコンピュータ「富岳(ふがく)」:スーパーコンピュータ「京」の後継機として理化学研究所が整備を進めている計算機。令和2年6月にスパコンランキング4部門で1位を獲得するなど,世界トップの性能を持つ。令和3年度中に本格運用が開始される予定だが,「富岳」成果創出加速プログラムは,令和2年度から試行的に計算資源の提供を受けている。
注5 Deep Tensor:富士通研究所が開発した人やモノのつながりを表すグラフ構造のデータから新たな知見を導くAI技術。(2016年10月20日プレスリリース)
注6 ノンコーディングRNA:ゲノムに基づき生成されるRNA(リボ核酸)のうち,タンパク質の設計図とならないRNAの総称。
●問い合わせ先
東京医科歯科大学
総務部総務秘書課広報係
〒113-8510 東京都文京区湯島1-5-45
TEL 03-5803-5833
Fax 03-5803-0272
メール kouhou.adm@tmd.ac.jp
(株)富士通研究所
人工知能研究所
TEL 044-754-2674(直通)
メール fugaku-xai@ml.labs.fujitsu.com