「HealthBench」の記事一覧
-
AIの医療評価基準「HealthBench」をOpenAIが発表
2025-05-12 17:42
医療・健康OpenAIは、AIによる医療支援の能力を評価する新たなベンチマーク「HealthBench」を発表しました。これは世界60カ国の262人の医師と連携し、5,000件の現実的な医療会話と独自の評価基準に基づいて開発されたもので、AIが医療現場で安全かつ有用に活用できるかを測定するための基盤となります。各会話には専門医による詳細な評価軸が用意され、モデルの信頼性や改善の余地が明確化されます。
Page 1 / 1