
「食道癌診断AIの開発と動画を用いた検証」から見えてきたAIの利用シーンと実用化への展望・課題
今回は、2021年11月に行われたJDDW 2021 KOBE(第29回 日本消化器関連学会週間)において「食道癌診断AIの開発と動画を用いた検証」を発表された、大阪国際がんセンター 田尻絢香先生(現在は大阪大学医学部附属病院勤務)にお話しを伺いました。田尻先生は、当該研究を行った経緯や研究成果とともに、将来的な実臨床での「食道がん診断AI」の利用に対する展望についてお話しいただきました。尚、当演題は、JDDW 2021 KOBEにおいて、優秀演題賞及び若手奨励賞に選出されています。
拾い上げAIと鑑別AIの2つを用いて、内視鏡医のスキルと比較する研究デザイン
大阪国際がんセンターに勤務中、私は同じ病院の医師と共同で、「食道がんのAI」についての開発・研究を行っていました。医療分野でも特化型のAIが次々と開発される中で、「実際の腫瘍を鑑別する」ことを想定し、AIによる判定がどこまで可能であるのか、それが実臨床にどう活かしていけるのか、さまざまな検証が必要とされる時だったのだと思います。現在、大阪国際がんセンターでは、「食道がん」のAIを開発し、特定臨床研究まで進んでいます。
消化管がんの判定をAIがサポートする
これに対する研究は、数年前からいくつかの施設にて行われています。食道がんの診断時には、内視鏡画像上の色相から病変部を指摘するという特徴があります。食道がんが進行して内視鏡治療適応外となった場合、手術は胃や大腸といった他の消化管と比較しても患者への侵襲がより大きいため、より早期発見が求められるがんと考えます。私たちはこれまで、食道扁平上皮がんに対するAI診断システムを開発し、内視鏡医の診断スキルに劣らない診断精度があることを報告してきました。
今回はさらに一歩進め、拾い上げAIと鑑別AIの2つのシステムについて、実臨床での使用を想定し、内視鏡医の診断と正診率などを比較することで、その性能に対する検証を行いました。
拾い上げAIに期待されることは、非拡大内視鏡下にて色調と肉眼的な異変をキャッチし、「がんが疑われる部位」を指摘することにあります。一方の鑑別AIに対しては、拡大内視鏡下にてがん・非がんを鑑別することが期待されます。実臨床ではこの2つのシステムを使用して、まずはがんを疑う部位を拾い上げ、さらにその質的診断を行うことで、食道がんの診断を行うことを想定しています。
拾い上げAIにおいて感度が高く特異度が低い結果は想定内
私たちはまず、拾い上げAIにてがん63症例、非がん50症例の判定を行い、内視鏡医21名(内視鏡経験年数中央値5年)による判定結果との比較を行いました(図1)。
その結果、内視鏡医21名の平均よりも、拾い上げAIの方が感度は高くなりましたが、特異度は低いという結果になりました。特異度が低いことについては想定の範囲内でした。まずは拾い上げAIの感度を高めることで、「疑わしい病変」を取りこぼすことなく拾い上げることを目指していたためです。
鑑別ではより正確な判断が求められる病変について特に正診率が高かった
次に私たちは鑑別AIを使用し、がん83病変および非がん64病変の判定を行い、内視鏡医19名(内視鏡経験年数中央値12年)との比較を行いました(図2)。
その結果、内視鏡医の平均よりも、正診率・感度・特異度ともに、鑑別AIの方が優れていたという結果になりました。
さらに、鑑別AIの症例の特徴による正診率を比較すると、pMM以深(21例)では100%(内視鏡医平均89.0%)、病変径(≥20㎜)では96.8%(内視鏡医平均82.9%)と、より見逃してはならない、正確な鑑別診断が必要とされる症例において、かなり高い正診率を示しました(図3)。