NII，新型コロナウイルス肺炎CT画像をAI解析するためのプラットフォームを開発
-全国の病院から集めたCT画像をAIで選別し高品質なAI研究用データセットとして整備-

2020-9-29

COVID-19（新型コロナウイルス感染症）

情報・システム研究機構国立情報学研究所（NII）は，東海国立大学機構名古屋大学，順天堂大学，日本医学放射線学会などと共同で，新型コロナウイルス肺炎（COVID-19肺炎）のCT画像をAI解析するためのプラットフォームを開発した。

今回のAI解析用プラットフォームの開発では，NIIの医療ビッグデータクラウド基盤（図1）に収集・集積した1億6千万枚を超えるCT画像を活用し，大量の画像の中から肺炎CT画像を選別する機械学習手法をまず開発した。そして，その新たな選別手法によりリスト化された肺炎CT画像に，実際のPCR検査結果と放射線医によるCOVID-19肺炎典型度^（*1）の判定結果を付与してデータベース化した。このような手順で質の高いAI向け学習データセットを整備し，COVID-19肺炎研究のための新たなAI解析用プラットフォームとして開発した（図2）。

この COVID-19肺炎症例CT画像のAI解析プラットフォームはすでにCOVID-19肺炎研究に活用されている。名古屋大学の研究チームはCOVID-19肺炎症例CT画像データベースに独自にAIを適用することで，精度の高いCOVID-19肺炎典型度判定の手法を開発した（図3）。この手法では，COVID-19肺炎の典型例の識別タスクで83.3%の典型度識別性能を達成している^（*2）。また，炎症などの影響によりCT画像上で肺が識別困難な場合に，AIが的確に肺の形状を推定する手法も開発している。

NIIを中心とした研究チームでは，COVID-19肺炎研究のためのAI解析用プラットフォームをさらに整備するとともに，他の研究チームと連携してAIアルゴリズムを改良し，AI選別や判定の精度向上を目指す。

●背景

2019年末ごろに発生した新型コロナウイルス感染症（COVID-19）は急速に世界に広まり，多数の患者が発生している。2020年9月下旬における世界の累計感染者数は約 3,200万人，死亡者数は約98万人となっている^（*3）。我が国の累計感染者数は約8万人，死亡者数は約1,500人^（*4）で，さらに増加を続けている。COVID-19患者に対し適切な治療を行い，他者への感染を防ぐ上で，正確な診断方法が必要とされている。COVID-19の検査ではRT-PCR（reverse transcriptase polymerase chain reaction）が多く用いられるが，そのSensitivity（感度）は42%から71%と低い値を示す^（*5）。これに対しCT画像によるCOVID-19検査のSensitivity（感度）は97%と高いといった特徴がある^（*6）。日本は人口あたりのCT撮影装置保有数が高いため，COVID-19検査においてCT画像を活用できると考えられる。CT画像を用いた医師の診断を支援し，判断の定量化を目指す上で，コンピューターにより肺の状態を客観的に判断する評価手法の確立が求められている。

●開発した技術：AI解析用プラットフォーム

NIIは，東海国立大学機構名古屋大学，順天堂大学，日本医学放射線学会などと共同で，新型コロナウイルス肺炎（COVID-19肺炎）CT画像を迅速にAI解析するプラットフォームを開発・整備した。このプラットフォーム開発は，主に次の2つの技術開発からなっている。

(1) COVID-19肺炎CT画像を機械学習で効率良く選別する手法
(2) 放射線医による判定とPCR検査結果が付帯した高品質学習データの整備

このプラットフォーム開発には，NIIが中心となって構築・運営している医療画像ビッグデータクラウド基盤を活用している。このクラウド基盤には，匿名化したCT画像を全国の病院から日本医学放射線学会を通じて収集し，過去2年間に1億6千万枚を超えるCT画像を蓄積している（図1）。

図1 医療ビッグデータ利活用を促進するクラウド基盤のしくみ

まず，これらのCT画像からCOVID-19パンデミック以前と以後の肺炎症例を機械学習によって選別する手法を開発した（図2）。この手法を適用した結果，クラウド基盤から非COVID-19肺炎367症例，COVID-19肺炎320症例（2020年9月8日現在）が抽出された。この抽出されたCT画像にPCR検査結果と放射線医が判定したCOVID-19肺炎典型度のメタデータを付与した。このメタデータの付与では特に順天堂大学，日本医学放射線学会と密接に連携し，AI機械学習データとして質の高いCOVID-19肺炎CT画像をデータベースとして整備し，AI解析用プラットフォームとして開発した。

図2 COVID-19肺炎CT画像データベースの構築

●AI解析用プラットフォームの活用事例

NIIを中心としたチームが開発したAI解析用プラットフォームは，すでにCOVID-19関連の研究に活用されている。名古屋大学の研究チームは，このCOVID-19肺炎CT画像データベースに対してAIを適用し，高い精度でCOVID-19肺炎の典型度を判定できるAIを開発した（図3）。

図3 COVID-19肺炎典型度を判定するAIによる部位の分割結果。空気に富む肺胞領域はCTではX線透過率が高いために黒っぽく映る（正常部位）。ここに炎症が起こるとX線透過率が低下してすりガラスのような陰影を呈する（すりガラス影）。さらに細胞浸潤が激しくなると，いっそうX線透過率が低下して白く一様な陰影となる（コンソリデーション）。

名古屋大学チームのAIは，胸部CT画像を入力すると，そのCT画像のCOVID-19肺炎典型度を自動判定することができる。この名大チームAIは，COVID-19肺炎の典型例とそうでない例の識別タスクにおいて，現時点で83.3%程度の典型度識別性能を達成した。また，この解析を可能とするために，炎症などの影響でCT画像上の肺の形状が識別困難な場合でも，AIが的確に肺の形状を推定できる手法も開発した。なお，この名古屋大学チームを中心とした研究成果は，2020年9月に開催された第39回日本医用画像工学会大会にて発表された。

●社会的インパクトと今後の展望

医療画像AIの研究開発では，AIを学習させるために，一病院だけではなく，様々な病院で取得された多様で高品質な画像データ群が極めて重要でである。そのため，今回のCOVID-19肺炎のCT画像データベース構築と解析プラットフォームの開発では，NIIと日本医学放射線学会をはじめとする6つの医療画像に関連する臨床学会が中心となって進めAMEDが支援する研究プロジェクト「臨床研究等ICT基盤構築・人工知能実装研究事業」の「医療ビッグデータ利活用を促進するクラウド基盤・AI画像解析に関する研究」^（*7）を活用した。

この研究プロジェクトではCOVID-19の顕在化以前から，匿名化等の処理を行ったCT画像を含む医療画像を，国内の病院等からNIIが運営する医療ビッグデータクラウド基盤へ転送し蓄積していた。この転送には，NIIが運営する超高速の学術情報ネットワークSINET5^（*8）を利用しており，さらに，画像処理研究者もこのクラウド基盤にSINET5でアクセスして医療画像AIの研究開発を行っている（図1）。NIIが中心となり，超高速の通信ネットワークで臨床現場とクラウド基盤，さらに大学等の画像処理研究者をつなぐことで，大容量となる医療画像データ群を超高速で蓄積し迅速に研究活用する仕組みを整えた。このクラウド基盤には，CT画像に限ってもすでに1億6千万枚以上の画像が格納されている。また，全国の様々な臨床機関から収集されたデータベースとなっているのも特色。これらの仕組みにより，本クラウド基盤とSINET5を活用した医療画像AI研究が可能となり，全国の画像処理研究者が集結している^（*9）。

このクラウド基盤は，COVID-19肺炎に限らない臨床データが悉皆的・網羅的に収集されている。今回，この膨大なデータから，COVID-19肺炎のAI解析用プラットフォームを迅速に整備できたことになる。つまり，今回のNIIチームの成果は，ターゲット疾患を定めないで収集した過去のデータから，状況に応じて該当するデータを自動選別し，目的に最適なAI機械学習用データセットを極めて迅速に整備できる技術を開発したことを意味する。このことは，このクラウド基盤や超高速ネットワークSINET5を将来も継続して整備・運用すれば，未知の感染症などの国家的な緊急課題への対処にも有効だと確かめられたといえる。

●研究プロジェクトについて

本研究成果は，日本医療研究開発機構（AMED）「臨床研究等ICT基盤構築・人工知能実装研究事業」「医療ビッグデータ利活用を促進するクラウド基盤・AI画像解析に関する研究」の助成を受けたもの。

（*1）COVID-19肺炎典型度：CT画像を観察し典型的なCOVID-19肺炎に見えるものから肺炎とは解釈できないものまで4段階に分類したもの。放射線診断専門医がCT画像を以下の4つに分類した。1. COVID-19肺炎に典型的な所見を有するもの，2. 典型的とは言えない非特異的な所見で不確定なもの，3. 非典型的なもの，4. 肺炎の所見がないもの。これらを2群に分けて，COVID-19肺炎典型度の高い疑わしい症例（1と2）とそうではない症例（3と4）とした。
（*2）小田昌宏, 林雄一郎, 大竹義人, 橋本正弘, 明石敏昭, 森健策，「COVID-19症例の定量評価のためのCT像からの肺野自動セグメンテーション」，第39回日本医用画像工学会大会，2020年９月17日（木）
（*3）Coronavirus Update（2020年9月10日アクセス） https://www.worldometers.info/coronavirus/
（*4）厚生労働省国内の発生状況など（2020年9月10日アクセス） https://www.mhlw.go.jp/stf/covid-19/kokunainohasseijoukyou.html
（*5）Simpson S, Kay FU, Abbara S, et al.: Radiological Society of North America Expert Consensus Statement on Reporting Chest CT Findings Related to COVID-19. Endorsed by the Society of Thoracic Radiology, the American College of Radiology, and RSNA. Radiology: Cardiothoracic Imaging 2(2): 2020
（*6）Ai T, Yang Z, Hou H, et al.: Correlation of Chest CT and RT-PCR Testing for Coronavirus Disease 2019 (COVID-19) in China: A Report of 1014 Cases. Radiology 296(2): 2020
（*7）医療ビッグデータ利活用を促進するクラウド基盤・AI画像解析に関する研究：詳しくはhttps://www.nii.ac.jp/research/projects/amed/ を参照。
（*8）SINET5：Science Information NETwork 5。詳しくはhttps://www.sinet.ad.jp/ を参照。本研究では，通信相手を特定したプライベートな専用回線であるかのように仮想的に利用するサービスであるVPN（Virtual Private Network：仮想閉域ネットワーク）により医療画像等を転送している。
（*9）Murao K, Ninomiya Y, Han C, Aida K and Satoh S: Cloud platform for deep learning-based CAD via collaboration between Japanese medical societies and institutes of informatics. Proc. SPIE 11318, Medical Imaging 2020: Imaging Informatics for Healthcare, Research, and Applications, 113180T (2 March 2020) https://doi.org/10.1117/12.2543521

●問い合わせ先
情報・システム研究機構国立情報学研究所（NII）
https://www.nii.ac.jp/