「拡散モデル」の記事一覧
-
拡張可能なブロック拡散型言語モデルBD3-LMの提案
2025-05-08 18:18
科学・技術BD3-LMは、従来のオートレグレッシブモデルと離散拡散モデルの長所を統合し、柔軟な長さのテキスト生成や並列生成を可能にする新しい言語モデルです。トークンのブロック単位で拡散を行い、自己回帰的に文脈を捉えることで、精度を維持しつつ生成速度を向上させます。学習時にはノイズ率の最適化により高い安定性と低パープレキシティを実現し、従来の拡散モデルの限界を克服しています。
-
Inception Labs、新型LLM「Mercury」発表
2025-04-30 21:51
IT・ネットInception Labsは、世界初の商用規模の拡散型言語モデル(dLLM)「Mercury」を発表しました。従来のトークン逐次生成ではなく、粗から細への並列更新で最大1000トークン/秒の高速生成を実現。誤り訂正や構造的応答に優れており、コード生成モデル「Mercury Coder」ではGPT-4o Miniなどを凌駕する精度と速度を達成しています。APIやオンプレ提供に対応し、企業導入も進んでいます。
Page 1 / 1