「画像生成」の記事一覧
-
拡散モデルをやさしく解説
2025-05-19 13:06
科学・技術拡散モデルは、画像や動画の生成に使われるAI手法で、初めに完全なノイズ画像から始めて徐々にノイズを取り除きながら目的の画像を生成します。学習段階では、元画像に少しずつノイズを加え、モデルにそのノイズを正確に予測させることで精度を高めます。VAEによる圧縮表現やキャプションなしデータを混ぜる分類器なしガイダンスなどの工夫も特徴です。動画や音声、さらにはテキストにも応用可能ですが、特にテキストでは復元が難しい点が課題です。
-
Gemini 2.0 Flashで画像生成と編集が可能に、開発者向けプレビュー提供開始
2025-05-07 16:06
IT・ネットGoogleは、Gemini 2.0 Flashモデルでの画像生成機能を開発者向けにプレビュー提供開始しました。これにより、Gemini APIを通じて会話ベースでの画像生成や編集が可能になります。Google AI StudioやVertex AIで利用でき、開発者はより高いレート制限と品質改善された出力を活用できます。コードサンプルも公開されており、さまざまな応用が期待されます。教育や製品案内、クリエイティブ分野などでの活用が見込まれます。
Page 1 / 1