「拡散モデル」の記事一覧
-
Google、LLMに拡張性をもたらすGemini Diffusionを発表
2025-05-22 01:13
科学・技術GoogleがI/Oで発表した「Gemini Diffusion」は、従来のオートレグレッシブ生成に代わり、ノイズから出力を生成する拡散モデルを採用した初の商用LLMです。生成速度の高速化と自己修正能力の向上により、コードや数式の編集タスクに強みがあります。従来のTransformer構造を維持しつつ、出力方式が革新的で、次世代のLLMとして注目されています。
-
拡散モデルをやさしく解説
2025-05-19 13:06
科学・技術拡散モデルは、画像や動画の生成に使われるAI手法で、初めに完全なノイズ画像から始めて徐々にノイズを取り除きながら目的の画像を生成します。学習段階では、元画像に少しずつノイズを加え、モデルにそのノイズを正確に予測させることで精度を高めます。VAEによる圧縮表現やキャプションなしデータを混ぜる分類器なしガイダンスなどの工夫も特徴です。動画や音声、さらにはテキストにも応用可能ですが、特にテキストでは復元が難しい点が課題です。
-
拡張可能なブロック拡散型言語モデルBD3-LMの提案
2025-05-08 18:18
科学・技術BD3-LMは、従来のオートレグレッシブモデルと離散拡散モデルの長所を統合し、柔軟な長さのテキスト生成や並列生成を可能にする新しい言語モデルです。トークンのブロック単位で拡散を行い、自己回帰的に文脈を捉えることで、精度を維持しつつ生成速度を向上させます。学習時にはノイズ率の最適化により高い安定性と低パープレキシティを実現し、従来の拡散モデルの限界を克服しています。
-
Inception Labs、新型LLM「Mercury」発表
2025-04-30 21:51
IT・ネットInception Labsは、世界初の商用規模の拡散型言語モデル(dLLM)「Mercury」を発表しました。従来のトークン逐次生成ではなく、粗から細への並列更新で最大1000トークン/秒の高速生成を実現。誤り訂正や構造的応答に優れており、コード生成モデル「Mercury Coder」ではGPT-4o Miniなどを凌駕する精度と速度を達成しています。APIやオンプレ提供に対応し、企業導入も進んでいます。