HN प्रश्न: क्या कोई Tiny Language Models के साथ कोई शानदार प्रोजेक्ट बना रहा है?
(news.ycombinator.com)- Ollama में इस्तेमाल किए जा सकने वाले 0.5B-3B रेंज के मॉडल्स पर चर्चा
- सवाल यह है कि क्या किसी ने इन मॉडल्स को अपने workflow के हिस्से के रूप में इस्तेमाल करते हुए कोई शानदार टूल बनाया है
1 टिप्पणियां
Hacker News की राय
ollamaका उपयोग करके इसे SMS spam messages का जवाब देने के लिए सेट किया। हर नंबर को millennial gym दोस्त या 19वीं सदी के British gentleman जैसी persona दी गईLlama model का उपयोग करके वेबसाइटों पर cookie notices की पहचान की और EasyList Cookie में filter rules जोड़े। ज़्यादातर cookie notices का HTML/CSS मिलता-जुलता होता है, इसलिए
innerTextलेकर एक छोटे LLM से false positives को फ़िल्टर किया जा सकता है। 3B model पर्याप्त prompt engineering के साथ ठीक-ठाक प्रदर्शन देता है, और 7B में बिना अतिरिक्त लागत के false positive rate लगभग नहीं के बराबर है। code और prompts GitHub पर देखे जा सकते हैंn100 CPU वाले mini PC का उपयोग करके अलग-अलग genres और styles की कहानियाँ बनाई जा रही हैं। CPU fan ज़्यादा गरम नहीं होता, और यह productive तो नहीं है लेकिन मज़ेदार है
एक छोटी fish script का उपयोग करके मौजूदा git diff के आधार पर तीन commit messages बनाए जाते हैं। कई models टेस्ट कर रहा/रही हूँ, और जब ideas की ज़रूरत हो तब यह उपयोगी है। script और examples GitHub पर देखे जा सकते हैं
मेरे पास एक छोटा device है जो बातचीत के दौरान "winner" घोषित करने की कोशिश करता है
Jamie Brew की "Comedy Writing With Small Generative Models" talk की सिफारिश करता/करती हूँ। अगर आप उसके guitar उठाकर बजाने तक इंतज़ार करें, तो बेहतर रहेगा
Microsoft ने FLAME model (60M parameters) जारी किया है। यह Excel formulas की मरम्मत/पूर्णता में कहीं बड़े models (100B parameters से अधिक) से बेहतर है
Micro Wake Word, ESPs पर आवाज़ से जगाने के लिए एक library और device models का सेट है। इसे हाल ही में Home Assistants के पूरी तरह local Alexa alternative में deploy किया गया है
Gemma 2B को fine-tune करके सरकार द्वारा संचालित maternal health counseling phone line पर नई गर्भवती महिलाओं के urgent messages की पहचान की जाती है
लगभग 1m parameters का एक model बनाया जो Magic the Gathering cards को random तरीके से generate करता है। यह Karpathy के nanogpt पर आधारित है और इसमें कुछ features जोड़े गए हैं। अगर आपके पास Apple silicon Mac है, तो आप GitHub से सीधे model generate कर सकते हैं