LLM context length बढ़ाना

(slashpage.com)

4 पॉइंट द्वारा frida 2024-07-01 | 2 टिप्पणियां | WhatsApp पर शेयर करें

2 टिप्पणियां

frida 2024-07-02

कोरियाई भाषा वाले लंबे context LLM का उपयोग करने के लिए, LLM की context length को कुशलतापूर्वक बढ़ाने हेतु जाँचे और आज़माए गए विभिन्न तरीक़े

LongLoRA
shifted sparse attention और LoRA fine-tuning का उपयोग करके 8 गुना तक विस्तार
Rope-based Position Interpolation
Llama जैसे RoPE-आधारित embedding का उपयोग करने वाले मॉडलों में RoPE embedding को संशोधित करके लागू किया जा सकता है, और fine-tuning के माध्यम से context length को 16 गुना तक बढ़ाया जा सकता है
Dynamic NTK
fine-tuning के बिना NTK theory लागू करके 2 गुना से अधिक विस्तार
LongLM
परिवर्तित attention का उपयोग करके fine-tuning के बिना 4 गुना तक विस्तार
ChunkLlama
text को chunk में विभाजित करके fine-tuning के बिना Llama मॉडल की context length को 4 गुना तक बढ़ाना
Infini-attention
कम अतिरिक्त memory उपयोग के साथ 2M तक बढ़ाया जा सकता है और तेज़ inference संभव है, Gemini-Pro में लागू की गई विधि

superwoou 2024-07-02

यह शायद पहली बार है कि मैं ऐसा लेख देख रहा हूँ जिसमें ज़रा भी सारांश नहीं है।