人間の記憶を模倣するEM-LLM:無限コンテキストに対応した新アーキテクチャ
🕒
🔗
元記事を見る
カテゴリ
科学・技術EM-LLMは、人間のエピソード記憶とイベント認知の原理を模倣した大規模言語モデルの新たなアーキテクチャです。ファインチューニングを必要とせず、事実上無限の文脈長に対応可能で、高効率な処理を実現しています。トークン列を驚き度とグラフ理論に基づいてエピソードに区分し、必要に応じて類似性と時間的連続性に基づいてメモリを検索します。実験ではLongBenchなどで優れた性能を示し、RAG方式を超える精度も確認されました。