4 पॉइंट द्वारा frida 2024-07-01 | 2 टिप्पणियां | WhatsApp पर शेयर करें

2 टिप्पणियां

 
frida 2024-07-02

कोरियाई भाषा वाले लंबे context LLM का उपयोग करने के लिए, LLM की context length को कुशलतापूर्वक बढ़ाने हेतु जाँचे और आज़माए गए विभिन्न तरीक़े

  1. LongLoRA
    shifted sparse attention और LoRA fine-tuning का उपयोग करके 8 गुना तक विस्तार

  2. Rope-based Position Interpolation
    Llama जैसे RoPE-आधारित embedding का उपयोग करने वाले मॉडलों में RoPE embedding को संशोधित करके लागू किया जा सकता है, और fine-tuning के माध्यम से context length को 16 गुना तक बढ़ाया जा सकता है

  3. Dynamic NTK
    fine-tuning के बिना NTK theory लागू करके 2 गुना से अधिक विस्तार

  4. LongLM
    परिवर्तित attention का उपयोग करके fine-tuning के बिना 4 गुना तक विस्तार

  5. ChunkLlama
    text को chunk में विभाजित करके fine-tuning के बिना Llama मॉडल की context length को 4 गुना तक बढ़ाना

  6. Infini-attention
    कम अतिरिक्त memory उपयोग के साथ 2M तक बढ़ाया जा सकता है और तेज़ inference संभव है, Gemini-Pro में लागू की गई विधि

 
superwoou 2024-07-02

यह शायद पहली बार है कि मैं ऐसा लेख देख रहा हूँ जिसमें ज़रा भी सारांश नहीं है।