「言語モデル」の記事一覧
-
拡張可能なブロック拡散型言語モデルBD3-LMの提案
2025-05-08 18:18
科学・技術BD3-LMは、従来のオートレグレッシブモデルと離散拡散モデルの長所を統合し、柔軟な長さのテキスト生成や並列生成を可能にする新しい言語モデルです。トークンのブロック単位で拡散を行い、自己回帰的に文脈を捉えることで、精度を維持しつつ生成速度を向上させます。学習時にはノイズ率の最適化により高い安定性と低パープレキシティを実現し、従来の拡散モデルの限界を克服しています。
-
生成AIに頼らない文章の価値
2025-05-04 19:17
文化・芸術大学講師の筆者は、学生の課題に頻出するChatGPT的な文章に違和感を覚え、その背景と問題点を考察しています。AIの文章は冗長で空虚な表現が多く、思考力や独自性の欠如を助長する恐れがあると主張。たとえ稚拙でも、自分の言葉で書くことが重要であり、創作や思考のプロセスをAIに委ねるべきではないと警鐘を鳴らします。創造的表現の本質は人間の体験に基づく「自分の声」であると強調しています。
-
小型AIモデルPhiの進化、推論能力で大規模モデルに迫る
2025-05-01 01:02
科学・技術Microsoftは、小型言語モデルPhiシリーズの新バージョン「Phi-4-reasoning」「Phi-4-reasoning-plus」「Phi-4-mini-reasoning」を発表しました。これらのモデルは、小さなパラメータ数ながら複雑な推論タスクをこなす能力を持ち、従来は大型モデルでしか実現できなかった性能を実現しています。特にPhi-4-reasoning-plusは、米数学オリンピック予選問題で大規模モデルDeepSeek-R1を上回る成績を記録しました。教育やPC搭載AIへの応用も進んでおり、省エネで高速な推論が可能です。Microsoftは、これらのモデルに責任あるAI原則を適用して開発を進めており、安全性や公平性にも配慮しています。