2022-3-7
富士通(株)(注1)(以下,富士通)と国立大学法人東京医科歯科大学(注2)(以下,東京医科歯科大学)は,富士通が開発した現場のデータから新たな発見の手掛かりを提示する技術「発見するAI」をスーパーコンピュータ「富岳」(注3)上に実装し,従来は実行困難であった2万変数のデータを一日以内で超高速計算することが可能で,1,000兆通りの可能性から未知の因果を発見できる技術(以下,本技術)を開発した。
両者が,がん医療と創薬の現場課題である抗がん剤の薬剤耐性(注4)を分析するために,がんの細胞株から得られた遺伝子発現量(注5)データに本技術を適用した結果,これまでの研究成果では知られていない,肺がん治療薬の耐性の原因を示唆する遺伝子の新たな因果メカニズムを抽出することに成功した。これにより,患者一人ひとりに対応した効果的な抗がん剤創薬の実現に向けて本技術の活用が期待できる。
両者は今後,さらに時間軸や位置データなどの多くのデータを組み合わせた多層的,総合的な分析を実施し,薬効メカニズムやがんの起源の解明などの重要課題における発見の手掛かりを提示する研究を加速するとともに,医療や創薬分野だけでなく,複雑に交錯する因子を発見して意思決定を行うようなマーケティングやシステム運用,生産現場など,活用分野の拡大に取り組んでいく。
開発背景と課題
がんの分子標的薬(注6)は,患者への投与を続けると,その薬剤に対して耐性を獲得したがん細胞が増殖し,再発することがある。このように,複数のドライバー変異(注7)を獲得した細胞群が変幻自在に異常な振る舞いをするがん耐性獲得のメカニズム解明には,精緻なデータと解析技術が不可欠である。薬剤開発や既存薬の再配置(注8)の臨床治験では,薬剤効果が期待される患者のおおまかな同定が重要だが,個人や臓器における遺伝子やその発現量などにより薬剤効果が異なり,複数の遺伝子の発現量を組み合わせたパターン数は1,000兆通りを超える(注9)ほど膨大なため,医療や創薬の進歩の鍵を握る効率性が高い探索技術への期待が高まっている。
富士通の開発技術「発見するAI」は,判断根拠の説明や知識発見が可能なAI技術「Wide Learning」(注10)を用いて,特徴的な因果関係を持つ条件を網羅的に抽出する技術として開発(注11)されたが,ヒトの全2万個の遺伝子を対象とした網羅的な探索には通常の計算機で4,000年以上かかる試算であったため,処理の高速化が課題となっていた。
開発した技術
両者は,プロセッサ間とプロセッサ内の並列性を特長とするスーパーコンピュータ「富岳」上にヒトの全遺伝子を実用的な時間で分析できるよう,条件探索と因果探索を行うアルゴリズムを並列化し,実装することで,計算性能を最大限引き出した。さらに,「発見するAI」を活用し,統計情報に基づき薬剤耐性を生み出す条件となりうる有望な遺伝子の組み合わせを抽出することで,一日以内で網羅的な探索を実現する技術を開発した。
効果
スーパーコンピュータ「富岳」上で本技術を用いてDepMap(注12)の公開データを実行した結果,ヒトの全遺伝子に対して条件と因果関係を一日以内で網羅的に探索し,肺がんの治療薬に耐性を持つ原因となる遺伝子を特定することに成功した。肺がんの治療薬などで用いられるゲフィチニブは,EGFR経路(注13)の活性化を押さえてがんの進行を抑える分子標的薬であり,耐性が発生する現象が知られている。DepMapのがん細胞株約300種の遺伝子発現量データとゲフィチニブの感受性,耐性データを解析し,ゲフィチニブが効かないがん細胞株の条件とメカニズムを網羅的に探索した結果,ZNF516, E2F6, EMX1 の3つの転写因子(注14)の発現量が低いという条件を探り当て,その条件を満たす肺がん細胞株では,転写因子SP7 とPRRX1 をトリガーとするメカニズムが耐性を生み出す因果として新たに示唆された。
なお,本技術開発は,スーパーコンピュータ「富岳」成果創出加速プログラム(注16)において,東京医科歯科大学と京都大学,富士通などが参画する課題「大規模データ解析と人工知能技術によるがんの起源と多様性の解明」解決に向けた取り組みの一環として実施した。
京都大学 医学研究科 教授 小川誠司氏のコメント
「Wide Learning」を用いた「発見するAI」は,薬剤開発の際の重要な興味であるバイオマーカー探索に資する技術となるでしょう。新規薬剤開発の成功の鍵は,効果が期待される患者さんを同定して臨床試験を行うことです。たとえばイマチニブを慢性骨髄性白血病ではなく大腸がんに対して治験を行えば必ず失敗します。そこで,薬剤の効果が期待できる人を予測するマーカー(遺伝子変異や遺伝子発現情報)があれば,その人だけを対象として臨床試験を行うことで,臨床試験の経費を大きく削減し,その成功確率を高めることができます。この点から,本課題の技術は製薬メーカー等が大いに興味を持つことが期待されます。「富岳」に実装されている点も期待感を大きくしています。
今後
両者は今後,遺伝子の発現量や変異のデータに加え,時間軸や位置データを組み合わせた多層的,総合的な分析を実施し,薬効メカニズムやがんの起源の解明などの重要課題における発見の手掛かりを提示する研究を加速するとともに,創薬,医学分野における実験研究の現場と連携していく。東京医科歯科大学は,本研究で開発した技術を用いて,がんをはじめとする難病の攻略法の研究を推進する。さらに,富士通は,マーケティングやシステム運用,生産現場において複雑に交錯する因子を発見し,意思決定を支援する取り組みを進める。
謝辞
本研究は,文部科学省のスーパーコンピュータ「富岳」成果創出加速プログラム「大規模データ解析と人工知能技術によるがんの起源と多様性の解明」(JPMXP1020200102)の一環として実施されたものです。また,本研究の一部は,スーパーコンピュータ「富岳」の計算資源の提供を受け,実施した(課題番号:hp200138, hp210167)。
商標について
記載されている製品名などの固有名詞は,各社の商標または登録商標。
注釈
注1 富士通(株):本社 東京都港区,代表取締役社長 時田 隆仁。
注2 国立大学法人東京医科歯科大学:所在地 東京都文京区,学長 田中雄二郎。
注3 スーパーコンピュータ「富岳」:
スーパーコンピュータ「京」の後継機として理化学研究所に設置された計算機。2020年6月から2021年11月にかけて世界のスーパーコンピューターに関するランキングの主要4部門で4期連続で1位を獲得するなど,世界トップの性能を持つ。2021年3月9日から共用開始。
注4 薬剤耐性:
薬剤の投与を続けているうちに,その薬剤の効果が弱まってしまう現象。
注5 遺伝子発現量:
DNAから複写されたRNA(転写により一部のDNA配列を鋳型として合成されたDNAと同じ核酸)の量。
注6 分子標的薬:
病気の原因となっている分子(タンパク質や遺伝子等)だけに作用するように設計された治療薬。
注7 ドライバー変異:
がんの発生や悪化の直接的な原因となる遺伝子変異。
注8 既存薬の再配置:
ある疾患の治療薬として開発,認可された既存薬を,別の疾患治療用に適用すること。
注9 1,000兆通りを超える:
がんに関係することが判明している主な50個の遺伝子の組み合わせに限定し,各遺伝子の発現量を2分類(遺伝子の発現の「高い」「低い」など)とした場合でも,条件数は2の50乗となり,1,000兆通りを超える。
注10 「Wide Learning」:
公式サイト「Hello, Wide Learning!
」
注11 特徴的な因果関係を持つ条件を網羅的に抽出する技術として開発:
「ヒトやモノなどのデータの一つひとつが持つ特徴的な因果関係を発見する技術を開発
」(2020年12月17日プレスリリース)
注12 DepMap:
米Broad Instituteが提供する約600種の様々ながん細胞株に対する約4500の薬剤の感受性,耐性のデータ。がん細胞株の変異情報と全遺伝子の発現データ等が含まれる。(https://depmap.org/portal/)
注13 EGFR経路:
上皮成長因子(EGF)という生体分子の刺激を受け取って,細胞増殖を活性化するメカニズム。
注14 転写因子:
遺伝子の転写(RNAの合成)を制御する遺伝子。
注15 上皮間葉転換(EMT):
上皮系の細胞から遊走性を獲得した間葉系の細胞に転換する現象で,がんの転移に関与していることが示唆されている。
注16 スーパーコンピュータ「富岳」成果創出加速プログラム:
2020年5月より開始した,文部科学省が「富岳」を用いて成果を早期に創出することを目的としたプログラム。
関連リンク
東京医科歯科大学と富士通研究所,「富岳」を用いてがんの遺伝子ネットワーク分析を1日以内に実現
(2020年11月10日プレスリリース)
●問い合わせ先
富士通(株)
研究本部 人工知能研究所
TEL044-754-2328(直通)
E-mail:fj-widelearning@dl.jp.fujitsu.com
東京医科歯科大学
総務部総務秘書課広報係
TEL 03-5803-5833
FAX 03-5803-0272
E-mail:kouhou.adm@tmd.ac.jp