生成AIを使って免疫関連有害事象(irAE)を特定する
Enhancing Precision in Detecting Severe Immune-Related Adverse Events: Comparative Analysis of Large Language Models and International Classification of Disease Codes in Patient Records
背景
免疫関連有害事象(irAE)は、免疫チェックポイント阻害薬(ICI)の治療において発現する、従来の抗がん剤治療とは異なるタイプの有害事象である。irAEに適切に対処し、知見を深める上でも、irAEを迅速かつ正確に把握することが不可欠であるが、現在のところは、人の手による非効率的なアプローチが主流である。
アメリカHarvard Medical SchoolのSunらは、2011年から2023年にICIによる治療を受けた患者の入院(n=7,555)を手作業によって独立にレビュー、irAEの有無を判定し、これをゴールドスタンダードとして、検索拡張生成(RAG)を組み合わせた大規模言語モデル(LLM)による高頻度irAE(大腸炎・肝炎・肺炎)、致死的irAE(心筋炎)の検出パフォーマンスを検証した。
結論
入院全体の2.0%がICI大腸炎、1.1%がICI肝炎、0.7%がICI肺炎、0.8%がICI心筋炎によるものと判定された。
LLMは、国際疾病分類(ICD)コードよりも感度が高く(94.7% vs. 68.7%)、irAE別では肝炎、心筋炎、肺炎について有意であった。特異度は同程度であった(93.7% vs. 92.4%)。
カルテ1件に要する時間は、LLMで平均9.53秒であったのに対し、手作業による判定では推定15分であった。検証コホートによる外部検証でも、LLMは高い感度と特異度を示した(98.1%, 95.7%)。
評価
LLMによるirAE検出アプローチは、感度でICDコードを凌駕し、判定時間も人の手に比べて大幅に高速化した。
従来のirAEについてのデータセットは大規模学術施設に偏っていたが、AIによって判定の障壁が取り除かれれば、より普遍的な洞察がもたらされるかもしれない。

