कोरियाई भाषा वाले लंबे context LLM का उपयोग करने के लिए, LLM की context length को कुशलतापूर्वक बढ़ाने हेतु जाँचे और आज़माए गए विभिन्न तरीक़े
LongLoRA
shifted sparse attention और LoRA fine-tuning का उपयोग करके 8 गुना तक विस्तार
Rope-based Position Interpolation
Llama जैसे RoPE-आधारित embedding का उपयोग करने वाले मॉडलों में RoPE embedding को संशोधित करके लागू किया जा सकता है, और fine-tuning के माध्यम से context length को 16 गुना तक बढ़ाया जा सकता है
Dynamic NTK
fine-tuning के बिना NTK theory लागू करके 2 गुना से अधिक विस्तार
LongLM
परिवर्तित attention का उपयोग करके fine-tuning के बिना 4 गुना तक विस्तार
ChunkLlama
text को chunk में विभाजित करके fine-tuning के बिना Llama मॉडल की context length को 4 गुना तक बढ़ाना
Infini-attention
कम अतिरिक्त memory उपयोग के साथ 2M तक बढ़ाया जा सकता है और तेज़ inference संभव है, Gemini-Pro में लागू की गई विधि
2 टिप्पणियां
कोरियाई भाषा वाले लंबे context LLM का उपयोग करने के लिए, LLM की context length को कुशलतापूर्वक बढ़ाने हेतु जाँचे और आज़माए गए विभिन्न तरीक़े
LongLoRA
shifted sparse attention और LoRA fine-tuning का उपयोग करके 8 गुना तक विस्तार
Rope-based Position Interpolation
Llama जैसे RoPE-आधारित embedding का उपयोग करने वाले मॉडलों में RoPE embedding को संशोधित करके लागू किया जा सकता है, और fine-tuning के माध्यम से context length को 16 गुना तक बढ़ाया जा सकता है
Dynamic NTK
fine-tuning के बिना NTK theory लागू करके 2 गुना से अधिक विस्तार
LongLM
परिवर्तित attention का उपयोग करके fine-tuning के बिना 4 गुना तक विस्तार
ChunkLlama
text को chunk में विभाजित करके fine-tuning के बिना Llama मॉडल की context length को 4 गुना तक बढ़ाना
Infini-attention
कम अतिरिक्त memory उपयोग के साथ 2M तक बढ़ाया जा सकता है और तेज़ inference संभव है, Gemini-Pro में लागू की गई विधि
यह शायद पहली बार है कि मैं ऐसा लेख देख रहा हूँ जिसमें ज़रा भी सारांश नहीं है।