4 ポイント 投稿者 frida 2024-07-01 | 2件のコメント | WhatsAppで共有

2件のコメント

 
frida 2024-07-02

長いコンテキストを持つ韓国語 LLM を使うため、LLM のコンテキスト長を効率的に伸ばすために調査・試行したさまざまな方法。

  1. LongLoRA
    shifted sparse attention と LoRA ファインチューニングを活用し、最大 8 倍まで拡張

  2. Rope-based Position Interpolation
    Llama のように RoPE ベースの埋め込みを使用するモデルに対して、RoPE 埋め込みを修正して適用でき、ファインチューニングにより最大 16 倍までコンテキスト長を拡張

  3. Dynamic NTK
    ファインチューニングなしで NTK 理論を適用し、2 倍以上に拡張

  4. LongLM
    変形したアテンションを使用し、ファインチューニングなしで最大 4 倍まで拡張

  5. ChunkLlama
    テキストを Chunk に分解し、ファインチューニングなしで Llama モデルのコンテキスト長を 4 倍に拡張

  6. Infini-attention
    少ない追加メモリ使用量で 2M まで延長可能で、高速な推論が可能。Gemini-Pro に適用された方法

 
superwoou 2024-07-02

要約がまったくない文章は、これまた初めてですね