「自然言語処理」の記事一覧
-
拡張可能なブロック拡散型言語モデルBD3-LMの提案
2025-05-08 18:18
科学・技術BD3-LMは、従来のオートレグレッシブモデルと離散拡散モデルの長所を統合し、柔軟な長さのテキスト生成や並列生成を可能にする新しい言語モデルです。トークンのブロック単位で拡散を行い、自己回帰的に文脈を捉えることで、精度を維持しつつ生成速度を向上させます。学習時にはノイズ率の最適化により高い安定性と低パープレキシティを実現し、従来の拡散モデルの限界を克服しています。
-
自然言語で機械学習モデルを構築できるPlexe
2025-05-06 15:38
IT・ネットPlexeは、自然言語による記述だけで機械学習モデルを自動生成できる革新的なツールです。利用者は意図や入出力スキーマをテキストで記述するだけで、AIエージェントが設計、学習、評価、デプロイまで一貫して処理します。分散学習にも対応し、OpenAIやAnthropic、Hugging Faceなど複数のLLMプロバイダと連携可能。データ生成やスキーマの自動推論も可能で、技術者以外のユーザーにも使いやすい設計となっています。
-
ChatGPTが自然言語処理の常識を変えた瞬間
2025-05-01 07:51
IT・ネット自然言語処理(NLP)分野は、ChatGPTをはじめとする大規模言語モデル(LLM)の登場により、未曾有の変革期を迎えました。2017年のTransformer論文から始まり、BERTやGPT-3が登場、ChatGPTの公開で業界構造が一変。学術界では既存の研究が無意味になったと感じる研究者も多く、技術の本質的理解や倫理問題も議論の的となりました。従来の研究手法や教育、キャリア観が揺らぐ中、NLP分野は「AI」の一部として再定義されつつあります。
-
Qwen3公開:柔軟な思考モードと119言語対応の新世代モデル
2025-04-28 20:44
科学・技術AlibabaのQwenプロジェクトが、Qwen3シリーズを発表。大規模MoEモデルから小型モデルまで幅広く揃い、柔軟な思考モード切替、119言語対応、高度なエージェント機能を搭載。プレトレーニングとポストトレーニングの両面で大幅な改良が加えられている。