「ベンチマーク」の記事一覧
-
AIの医療評価基準「HealthBench」をOpenAIが発表
2025-05-12 17:42
医療・健康OpenAIは、AIによる医療支援の能力を評価する新たなベンチマーク「HealthBench」を発表しました。これは世界60カ国の262人の医師と連携し、5,000件の現実的な医療会話と独自の評価基準に基づいて開発されたもので、AIが医療現場で安全かつ有用に活用できるかを測定するための基盤となります。各会話には専門医による詳細な評価軸が用意され、モデルの信頼性や改善の余地が明確化されます。
-
Sep 0.10.0、AMD 9950Xで21GB/sを達成したCSVパーサー
2025-05-09 13:38
科学・技術Sep 0.10.0は、.NET 9.0環境とAVX-512対応CPU、特にAMDのZen 5アーキテクチャを活用することで、単一スレッドで最大21GB/sという驚異的なCSVパース速度を実現しました。従来のAVX-512パーサーの非効率性を回避するため、AVX-512-to-256パーサーを導入し、マスクレジスタの使用を抑制。さらに、Vector256ベースのクロスプラットフォーム対応や、マルチスレッドでの8GB/s超の実行性能も報告されています。ハードウェアとソフトウェアの進化が連携することで、大幅な性能向上が達成されました。
Page 1 / 1