日本語の医学関連文書などを大量に学習した医療用生成人工知能(AI)の「大規模言語モデル(LLM)」を、政府主導で開発したことが29日、関係者への取材で分かった。問診結果から病名候補を示すことができる。近く公開し、医療機関で診療支援や業務の効率化に活用してもらうほか、企業や研究機関によるAIの製品開発を促したい考え。
LLMは生成AIの基盤となる技術。医療用LLMは海外でも開発されているが、日本語による学習データの比率が極めて低く、日本人特有の病気などの実態が反映されない恐れがある。海外製を使うことによって個人情報が国外流出する懸念もあり、政府プロジェクトの一環として国立情報学研究所などのチームが国産LLMを開発した。
許諾を得た少なくとも70万件の医学論文や、信頼できる医療サイトに掲載された約1600万件の文書、医学教科書などを学習させた。
性能を評価するため医師国家試験を解かせたところ、合格基準を超え、海外製も含めた最先端のLLMの中でトップクラスの得点を挙げた。