LLMのコンテキスト長を伸ばす

(slashpage.com)

4 ポイント投稿者 frida 2024-07-01 | 2件のコメント | WhatsAppで共有

2件のコメント

frida 2024-07-02

長いコンテキストを持つ韓国語 LLM を使うため、LLM のコンテキスト長を効率的に伸ばすために調査・試行したさまざまな方法。

LongLoRA
shifted sparse attention と LoRA ファインチューニングを活用し、最大 8 倍まで拡張
Rope-based Position Interpolation
Llama のように RoPE ベースの埋め込みを使用するモデルに対して、RoPE 埋め込みを修正して適用でき、ファインチューニングにより最大 16 倍までコンテキスト長を拡張
Dynamic NTK
ファインチューニングなしで NTK 理論を適用し、2 倍以上に拡張
LongLM
変形したアテンションを使用し、ファインチューニングなしで最大 4 倍まで拡張
ChunkLlama
テキストを Chunk に分解し、ファインチューニングなしで Llama モデルのコンテキスト長を 4 倍に拡張
Infini-attention
少ない追加メモリ使用量で 2M まで延長可能で、高速な推論が可能。Gemini-Pro に適用された方法

superwoou 2024-07-02

要約がまったくない文章は、これまた初めてですね