「信頼性」の記事一覧
-
AIに必要なのは「検証する力」— 知識の自己評価の重要性
2025-05-09 05:10
科学・技術AI研究において、システムが自ら動作の正しさを判断できる能力、すなわち「検証」が極めて重要であるとする主張が提示された。従来の専門知識ベースのAIは複雑化と脆弱性に悩まされてきたが、自己検証が可能なシステムは信頼性と拡張性に優れる。検索型AIや強化学習のような手法においては、動作選択の正当性を内部で評価できることが成功の鍵であるとされる。
-
LLMアップグレードが信頼性指標を損なう理由
2025-05-06 23:22
科学・技術LLMのアップグレードにより、モデルの出力に対する信頼度指標が失われる現象を解説した技術記事。特にGPT-4.1-miniでは出力に対するlog-probが極端に高くなり、誤出力でも高信頼で出力する傾向が顕著に。これにより、コンテンツモデレーションやポリシー違反検知における誤検出が増加。対策として、明示的なポリシー引用やフィルタリングルールが導入されている。
Page 1 / 1