「AI医師」も誕生する? 医療分野でChatGPTはどう使われていくか

膨大な情報処理を可能にしたChatGPTが、医療・ヘルスケア分野でも注目されています。

従来の「デジタル」を超えて、過去の症例や研究データをもとに、特に創薬分野での期待が高まっています。

また、海外では診察から処方まで一連の医療行為を生成AIで行う試みも始まっています。

医療・ヘルスケア分野に生成AIを導入することでどのように業界は変化していくのか、先端事例をもとにその一端を覗いてみましょう。

AIと医療

AIと医療の関係について、厚生労働省の2017年の検討会では具体的な実用化の方向性が示されています。

特に下の領域は、AIの実用化が比較的早いとされています。

図表1:AIの実用化が比較的早いと考えられる領域

<出典:保健医療分野におけるAI活用推進懇談会|厚生労働省 p3>

画像診断支援には大腸や肺を対象にすでにAIが導入され、他の部位についてもスタートアップから大手まで多くの企業が参入しています*1

医療や創薬は、ある意味ではこれまでのデータの蓄積の上に成り立っていると言えます。
そこにChatGPTというツールが登場したことで、AI活用の機運がさらに高まっているのです。

平均成長率「85%」での拡大予測も

医療・ヘルスケア分野での生成AI利用は大きな成長が見込まれています。

ボストンコンサルティンググループ(BCG)は、ヘルスケアは生成AIの活用が最も期待される領域だとしています。この領域での生成AI市場は2025年までに年平均成長率が85%で拡大するとの見通しです*2

具体的には治験報告書、カルテの作成、患者への説明などが想定されています。アメリカの一部では、医師がある程度キーワードを書くとAIがカルテの流れを下書きしてくれるという技術の実装が始まっているといいます*3

また興味深いことに、カリフォルニアのサンディエゴ校の調査によると、医療に関する質問への「回答内容の質」についての専門家の評価は、医師よりもChatGPTのほうが高かったことがわかっています。

図表2:患者の質問に対する医師とChatGPTの回答の評価

それどころか、医師よりもChatGPTの方が「思いやりがある」と、こちらは明確に評価が分かれているのです。

カルテ、医療文書作成の試みは国内でも

医師の働き方改革に向けて、医療文書の生成AIでの作成は国内でも試みが始まっています。

東北大学病院などは、日本語の大規模言語モデル(LLM)を使って、電子カルテから紹介状や保険診断書などを自動作成する実証実験を行いました。

図表3:東北大学病院での実証実験

2023年の10月~11月にかけて東北大学病院で行われた実験では、紹介状や退院サマリ(入院患者の病歴や入院時の所見、入院中の治療などについての要約)の作成時間を平均47%削減できたという結果が得られています。文章の表現や信頼性においても高い評価を得たといいます*4

最も期待が高まる創薬分野への応用

そして、医療分野の中でも、生成AIに大きな期待をかけているのが創薬・製薬業界です。

米系ITコンサルティング企業のガートナーは、「生成AIで最も影響を受ける業界」のひとつに製薬を挙げています。
そのうえで、2025年までに新薬や新材料の30%以上が生成AI手法を用いて体系的に発見される(現在は0%)との見通しを示しています*5

新しい素材や医薬品の発見には、膨大な量の試行錯誤が必要です。製薬会社では収益の約20%を研究開発に費やしており、それでも新しい薬の開発には平均で10年から15年の時間を要するといいます*6

それゆえ実験の成功率が収益の大きな鍵を握ることになりますが、ひとくちに化合物といっても、世界には莫大な種類のものがあります。

そこから新薬候補となるものを探すために、大量のデータ処理が可能な生成AIが役立つというわけです。

創薬AIの利用により、医薬品の開発費は1品目あたり600億円削減されるとの報告もあります。

図表4:創薬AIがもたらす経済効果

<出典:創薬における人工知能応用|厚生労働省資料 p16>

また、時間の短縮という意味では、香港に拠点を置くAI創薬企業インシリコ・メディシンがAIでデータベースを解析して新薬候補を探し出し、なおかつ候補物質の設計に生成AIを活用するという手法で、わずか18か月でFDA(米食品医薬品局)から新薬の認可を受けたという話もあります*7

中国では診察から処方までをAIが行う実験も

さらに中国では、患者の診察から診断、治療方法、処方、さらなる検査が必要かどうかの判断、患者への自然言語での説明までを生成AIで行うという実験も行われました。

大手デジタルヘルスケア企業のMedlinkerが開発した「MedGPT」を使って実際の患者120名と四川大学西中国病院の医師10名が参加した実験のデモンストレーションは、中国の著名医師7名が人間とAIの診察などの正確性を採点するという方法で行われました。

MedGPTには過去の症例などの情報が大量に詰め込まれています。

その結果、診察の正確さや診断、治療方法、処方、投薬指導、生活指導、さらなる検査が必要かどうかの判断、患者への自然言語での説明など一連の医療行為について、人間の医師のスコアが10点満点中7.5点だったのに対し、MedGPTは7.2点を叩き出したといいます。

出典5:MedGPTの正確性スコア

実験では医療助手が患者から聞き取った情報をオンラインでテキストベースでMedGPTと医師それぞれに同時に伝えています。MedGPTは医師の補助的な役割として動くのではなく完全に独立した存在で診断を実施しているのです。
さらに、ある分野に特化した医師とは異なり、MedGPTは専門分野外の病気にも対応できるメリットがあるともいいます。

今後どこまで実用化されるかはわかりませんが、医療の形そのものを変えてしまう可能性すらあります。オンライン診療との組み合わせも考えられます。

人間以上の記憶力を持つAIがどのように存在感を示していくか注目されているのは、医療分野も例外ではないのです。

この記事を書いた人

清水沙矢香

2002年京都大学理学部卒業後、TBSに主に報道記者として勤務。社会部記者として事件・事故、テクノロジー、経済部記者として各種市場・産業など幅広く取材、その後フリー。
取材経験や各種統計の分析を元に多数メディアに寄稿中。