IBM、新型LLM『Bamba』を発表
🕒
🔗
元記事を見る
カテゴリ
IT・ネットIBMがCMUやプリンストン大学と協力して開発した新しい大規模言語モデル『Bamba』は、トランスフォーマーの表現力とステートスペースモデル(SSM)の高速処理性能を兼ね備えたハイブリッドモデルです。Bambaは、従来のTransformerの課題である「二乗的な計算コスト(KVキャッシュ)」を大幅に削減し、高速かつ長文処理に対応可能。Granite 4.0への導入も予定されており、Llama-3に匹敵する性能を示しています。完全オープンソースで公開され、今後さらなる発展が期待されています。