ニュースボイス

2025-05-22 16:34

科学・技術

Anthropicは新世代AIモデル「Claude Opus 4」と「Claude Sonnet 4」を発表しました。Opus 4は世界最高レベルのコーディング性能を誇り、長時間の作業や複雑なタスクにも対応。Sonnet 4は迅速かつ高精度な推論を実現し、GitHub Copilotにも採用予定です。ツール使用やメモリ機能の強化、API拡張など新機能が多数搭載されており、開発支援やAIエージェント構築に最適なモデルへと進化しています。

Googleがモバイル特化のAIモデル「Gemma 3n」発表

2025-05-20 18:03

IT・ネット

Googleは最新の軽量AIモデル「Gemma 3n」を発表し、スマートフォンやタブレット上での高速かつ低メモリな実行を可能にしました。画像・音声・テキストの統合処理に対応し、Gemini Nanoとの連携で、オンデバイスAIの可能性を拡大。開発者向けにプレビュー公開され、AndroidやChromeへの展開が予定されています。

Windsurfが初のフロンティアモデルSWE-1を発表

2025-05-15 18:47

IT・ネット

Windsurfは、初の大規模言語モデル「SWE-1」のリリースを発表しました。詳細な情報は未公開ながら、同社の製品ラインやAPI提供を通じて、商用利用や研究用途を見据えた展開が示唆されています。これにより、LLM市場における新たな競争軸として注目されています。SWE-1は今後のアップデートと共に、企業や開発者に対し柔軟な言語生成能力を提供する可能性があります。

CTM：思考を模倣する新しいAIモデル

2025-05-12 02:21

科学・技術

Sakana AIによる新しいAIアーキテクチャ「Continuous Thought Machine（CTM）」は、従来のニューラルネットワークとは異なり、内部的な「思考ステップ」を持つことで、時系列的な思考を可能にします。ニューロン単位の動的な処理と同期を通じて、CTMは迷路解決や画像分類、記憶再生などにおいて高い汎化能力を示しました。CTMは生物脳に触発された設計思想に基づき、AIにおける知性の新たな可能性を開いています。

注意機構の「なぜ」を深掘りする：LLM自作記第13回

2025-05-08 21:06

科学・技術

LLMを自作するブログシリーズの第13回では、自己注意機構の「なぜ」に焦点を当て、個々の注意ヘッドが実は単純なパターンマッチングであることを明らかにします。著者は、複数の注意層とマルチヘッド構成によって、情報が段階的に豊かになり、文脈理解が深まる仕組みを解説。また、従来の固定長ベクトルに代わり、入力トークン数に比例する柔軟な表現が得られるという利点についても述べています。

「AIモデル」の記事一覧