「AI開発」の記事一覧
-
LLMアップグレードが信頼性指標を損なう理由
2025-05-06 23:22
科学・技術LLMのアップグレードにより、モデルの出力に対する信頼度指標が失われる現象を解説した技術記事。特にGPT-4.1-miniでは出力に対するlog-probが極端に高くなり、誤出力でも高信頼で出力する傾向が顕著に。これにより、コンテンツモデレーションやポリシー違反検知における誤検出が増加。対策として、明示的なポリシー引用やフィルタリングルールが導入されている。
-
Gemini 2.5 Proがもたらす次世代コーディング体験
2025-05-06 15:10
IT・ネットGoogleのGemini 2.5 Proは、フロントエンド開発やコード編集、エージェントベースのワークフロー構築に優れた性能を発揮する最新のAIモデルです。Web開発の美しさと機能性の両立を実現し、ReplitやCognitionなど複数の企業と連携して先進的な開発を推進。動画理解機能の向上により、動画から学習アプリを生成する機能も実装されており、開発者にとってより強力なツールとなっています。今回のアップデートで更なる信頼性とパフォーマンスが向上しました。
-
AIとWinDBGが切り拓くクラッシュ解析の未来
2025-05-05 05:11
IT・ネットソフトウェア開発の進化に比べ、クラッシュ解析は古典的なツールに依存し続けています。この記事では、GitHub CopilotとWinDBGを組み合わせ、AIと自然言語でクラッシュダンプを解析できる新手法「mcp-windbg」を紹介。AIがWinDBGのコマンド出力を解釈し、開発者の質問に文脈を踏まえて回答することで、クラッシュ解析の効率と理解度が大きく向上します。記事では、MCPプロトコルの役割や実装方法、導入手順についても詳しく解説しています。
-
OpenPipe ART:LLMを自己強化学習で訓練
2025-04-30 15:35
IT・ネットOpenPipe ARTは、大規模言語モデル(LLM)のエージェント的動作を強化学習によって最適化するオープンソースのライブラリです。従来の強化学習と異なり、ARTは既存のコードベースに統合可能で、学習ループの複雑さはサーバ側で処理されます。ユーザーはエージェントの実行を通じて得た軌跡に報酬を与え、GRPOアルゴリズムでモデルを訓練できます。2048やTic Tac Toeなどのタスクもサポートし、Hugging FaceやvLLMに対応。現在アルファ版として開発が進められており、貢献も歓迎されています。
-
Claude AIで3日間開発、ファンタジーNHLアプリ誕生
2025-04-26 17:04
IT・ネット北米移住者がNHLファンタジーリーグの既存アプリに不満を抱き、自作を決意。ReactフロントエンドとRustバックエンドで構築し、fly.ioで迅速にデプロイ。特にUI設計にはClaude AIの支援が大きく、NHL公式サイトのスクリーンショットをもとにデザイン改善を重ねた。AIの活用により、わずか数日で完成度の高いプロトタイプを実現。今後の一般公開やユーザー管理機能の追加も視野に入れている。