AIで3年以内の膵がんリスクを予測
A deep learning algorithm to predict risk of pancreatic cancer from disease trajectories
背景
膵がんは初期症状に乏しく、その多くが治癒的治療が不可能な段階で発見され、予後は極めて不良である。これまで、早期発見戦略がさまざまに模索されてきた。
デンマークUniversity of CopenhagenのPlacidoらは、デンマーク(Danish National Patient Registry)・アメリカ(US Veterans Affairs)の900万人超(うち膵がん症例 27,849件)の臨床データを用いて、臨床経過から将来の膵がんリスクを予測する機械学習モデルを構築した。
結論
DNPRデータで学習されたモデルのうち、最良のパフォーマンスを示したTransformerモデルは、将来3年以内のがん発症予測について、受信者動作特性下面積(AUROC)0.88を示した(次点はゲート付き回帰型ユニット[GRU]モデルで0.85)。直接的に膵がんに関連する可能性がある診断直前(3ヵ月・6ヵ月・12ヵ月)の疾患データを除外して学習を行うと、AUROCは各0.84・0.83・0.83まで低下した。モデルが予測した最高リスク(0.1%)の患者における推定相対リスクは、除外を行わなかった場合の105から、3ヵ月の除外で59まで低下した。DNPRでのモデルをUS-VAデータに適用すると、AUROCは0.71まで低下し、パフォーマンスの向上には再学習が必要となった(0.78)。
評価
家族歴・遺伝的リスクに基づく戦略は既にあり、効果も示しているが、本研究のモデルは、臨床記録・病歴データが利用可能なすべての個人で利用可能である点で優れている。ただし、異なるデータセットで予測精度が低下したことは重大な問題で、よりグローバルなデータセットでの、あるいは逆に各国のローカルなデータセットでの学習によって精度が保証されるかが検証課題である。