- हाल की MIT Technology Review की एक रिपोर्ट में लोकल LLM की तुलना ऑफलाइन बैकअप Wikipedia से करने का विचार पेश किया गया
- Ollama लाइब्रेरी के मुख्य LLM मॉडल फ़ाइल साइज़ और Kiwix द्वारा दिए गए ऑफलाइन Wikipedia बंडल के आकार की सीधे तुलना की गई
- LLM फ़ाइलें और Wikipedia डेटा का उद्देश्य, ताकत और सीमाएँ अलग हैं, इसलिए सीधी तुलना आसान नहीं है, लेकिन स्टोरेज क्षमता के आधार पर दिलचस्प अंतर दिखते हैं
- कुछ LLM (1~4GB मॉडल) साधारण English Wikipedia (लगभग 1GB) से बड़े हैं, जबकि पूरी Wikipedia (57GB) बड़े LLM (20~32GB) से भी बड़ी है
- फ़ाइल साइज़ के अलावा मेमोरी और CPU आवश्यकताओं जैसी व्यावहारिक बातों पर भी ध्यान देना ज़रूरी है, और वास्तविक उपयोग के आधार पर चुनाव बदल सकता है
लोकल LLM और ऑफलाइन Wikipedia की तुलना
परिचय और तुलना का संदर्भ
- MIT Technology Review में हाल ही में "How to run an LLM on your laptop" शीर्षक से एक लेख प्रकाशित हुआ
- लेख में इस बात पर ज़ोर दिया गया कि लोकल में LLM चलाकर ऑफलाइन माहौल में भी ज्ञान का उपयोग संभव है
- Simon Willison की यह तुलना प्रभावशाली है कि ऑफलाइन LLM Wikipedia के संक्षिप्त, अधूरे संस्करण जैसा है, और प्रलय जैसी स्थिति में सिर्फ USB के सहारे समाज को फिर से शुरू करने में मदद कर सकता है
मॉडल और डेटा साइज़ की तुलना
- Ollama लाइब्रेरी के कई LLM मॉडल और Kiwix द्वारा उपलब्ध ऑफलाइन Wikipedia बंडल फ़ाइल साइज़ की तुलना की गई
- तुलना के लिए ऐसे मॉडल चुने गए जिन्हें सामान्य उपभोक्ता हार्डवेयर पर चलाया जा सके, और Wikipedia डेटा को बिना इमेज वाले संस्करण तक सीमित रखा गया
- मुख्य तुलना परिणाम इस प्रकार हैं:
- सबसे छोटे सार-संक्षेप संस्करण
- Best of Wikipedia (शीर्ष 50,000, सार-संक्षेप): 356.9MB
- Simple English Wikipedia (सार-संक्षेप): 417.5MB
- प्रमुख LLM मॉडल (छोटे)
- Qwen 3 0.6B: 523MB
- Deepseek-R1 1.5B: 1.1GB
- Llama 3.2 1B: 1.3GB
- प्रमुख LLM मॉडल (मध्यम से बड़े)
- Deepseek-R1 8B / Qwen 3 8B: 5.2GB
- Gemma3n e4B: 7.5GB
- Deepseek-R1 14B: 9GB
- Qwen 3 14B: 9.3GB
- पूरी Wikipedia
- Wikipedia (पूर्ण): 57.18GB
- Wikipedia के शीर्ष 50,000 लेख 356.9MB के साथ बहुत छोटे हैं
- सबसे छोटा LLM (0.6B, Qwen) 523MB का है, जो साधारण Wikipedia सार-संक्षेप से बड़ा है
- पूरी Wikipedia (57.18GB), सबसे बड़े LLM (20GB) से भी काफी बड़ी है
तुलना की सीमाएँ और विचारणीय बातें
- सीधी तुलना कठिन है: विश्वकोश (डेटा) और LLM (जनरेटिव मॉडल) का उद्देश्य और संरचना मूल रूप से अलग हैं
- सिर्फ फ़ाइल साइज़ ही महत्वपूर्ण नहीं है: LLM को फ़ाइल साइज़ के अलावा चलते समय अधिक मेमोरी और CPU संसाधन चाहिए होते हैं। ऑफलाइन Wikipedia को कम-क्षमता वाले डिवाइस पर चलाना अपेक्षाकृत आसान है
- वास्तविक उपयोग के हिसाब से उपयोगिता: उदाहरण के लिए, सिर्फ chemistry क्षेत्र डाउनलोड किया जा सकता है, या किसी खास हार्डवेयर के लिए ऑप्टिमाइज़ किया गया LLM चुना जा सकता है
- चयन मानदंड की व्यक्तिपरकता: तुलना में इस्तेमाल की गई वस्तुओं का चयन कुछ हद तक व्यक्तिपरक है
निष्कर्ष और संकेत
- Wikipedia के शीर्ष 50,000 लेख और Llama 3.2 3B मॉडल फ़ाइल साइज़ के लिहाज़ से लगभग समान स्तर पर हैं
- सबसे छोटा Wikipedia बंडल सबसे छोटे LLM से भी छोटा है, जबकि पूरी Wikipedia फ़ाइल सबसे बड़े LLM से बड़ी है
- पर्याप्त स्टोरेज वाले माहौल में LLM और Wikipedia डेटा दोनों को डाउनलोड करके साथ में उपयोग करना भी विचार करने योग्य है
1 टिप्पणियां
Hacker News राय
gpgkeyकोhttpपर सेट कर दिया, जिससे security टूट गईwikipedia_en_all_maxi_2024-01.zimडाउनलोड कर रहा हूँ;libzimसे pages निकालकर उसे LLM से जोड़ने की योजना है; zim file में pages HTML के रूप में stored हैं और इसका आकार लगभग 100GB है; वजह यह है कि HDD में बहुत बड़ी संख्या में stored games की सूची है (सिर्फ titles, अलग category नहीं), और मैं उन्हें Wikipedia articles से match करके genre या अन्य जानकारी के हिसाब से व्यवस्थित करना चाहता हूँ; प्रयोग में देखा कि LLM (Mistral Small 3.2 quantized) हैरानी की बात है कि इस chaos को काफ़ी अच्छी तरह व्यवस्थित कर देता है;llama.cppसे custom script में इसे तेज़ी से चलाया जा सकता है"$1-distill-$2"जैसे नाम वाले models (कभी-कभी"-distill"नहीं भी होता) वास्तव में $2 model होते हैं जिन्हें $1 के outputs पर train करके बनाया गया “knowledge distillation” परिणाम माना जाना चाहिए, इसलिए नाम के विपरीत वे $1 स्वयं नहीं हैं; लेख में आया “Deepseek-R1 1.5B” जैसा model वास्तव में मौजूद नहीं है, बात कुछ ऐसी ही है