• Llama 3 का सबसे बड़ा वर्ज़न इस गर्मियों में लॉन्च होने वाला है, जबकि दो छोटे मॉडल अगले हफ्ते जारी किए जाएंगे
  • छोटे मॉडलों की रिलीज़ Llama 3 को लेकर उत्सुकता बढ़ाएगी
  • उम्मीद है कि Llama 3 में OpenAI के GPT-4 की तरह image-based question answering फीचर होगा
  • सबसे बड़ा वर्ज़न एक multimodal model होगा, जो टेक्स्ट और इमेज दोनों को समझ और जनरेट कर सकेगा
  • वहीं, अगले हफ्ते जारी होने वाले दो छोटे मॉडल multimodal नहीं होंगे

मॉडल के आकार के अनुसार फायदे और नुकसान

  • छोटे मॉडल आम तौर पर बड़े मॉडलों की तुलना में चलाने में सस्ते और तेज़ होते हैं
  • बड़े मॉडलों की रनिंग कॉस्ट को देखते हुए यह बात और भी ज़्यादा महत्वपूर्ण होती जा रही है
  • छोटे मॉडल उन डेवलपर्स के लिए भी उपयोगी हैं जो मोबाइल डिवाइस पर AI software विकसित करना चाहते हैं

Meta के Llama मॉडल विकास की स्थिति

  • Meta ने पहले Llama 2 के तीन मॉडल जारी किए थे
    • सबसे बड़े मॉडल में 70 अरब parameters हैं
    • बाकी दो मॉडलों में क्रमशः 13 अरब और 7 अरब parameters हैं
  • Llama 3 के सबसे बड़े वर्ज़न में 140 अरब से अधिक parameters होने की उम्मीद है
  • Meta, Llama 2 का उपयोग करके अपने ऐप्स में AI assistant फीचर दे रही है
  • पिछले कुछ महीनों में Meta की generative AI टीम के कर्मचारी Llama 3 को अधिक खुला बनाने पर काम कर रहे हैं, क्योंकि उनका मानना था कि Llama 2 विवादास्पद सवालों पर बहुत रूढ़िवादी तरीके से प्रतिक्रिया देता है

GN⁺ की राय

  • Meta Platforms की Llama 3 के छोटे वर्ज़न की रिलीज़ यह दिखाती है कि AI language model क्षेत्र में प्रतिस्पर्धा तेज़ हो रही है। पहले से ही Google और Elon Musk की xAI जैसे बड़े खिलाड़ी open source मॉडल लॉन्च कर चुके हैं, ऐसे में Meta का यह कदम मार्केट शेयर हासिल करने और तकनीकी नेतृत्व बनाए रखने की रणनीति के रूप में देखा जा सकता है।
  • छोटे वर्ज़न के मॉडल की रिलीज़ डेवलपर्स और शोधकर्ताओं को नए टूल दे सकती है, और इसके जरिए बड़े वर्ज़न के मॉडल को लेकर रुचि और उम्मीद दोनों बढ़ सकती हैं। यह एक marketing strategy भी हो सकती है, जिससे उपयोगकर्ता बड़े मॉडल का वास्तविक उपयोग करने से पहले छोटे मॉडल के साथ प्रयोग कर सकें और उससे परिचित हो सकें।
  • बड़े language models की रिलीज़ तकनीकी रूप से बहुत जटिल होती है, और ऐसे मॉडलों को प्रभावी ढंग से ट्रेन और बनाए रखने के लिए काफी computing resources और विशेषज्ञता की ज़रूरत होती है। Meta के पास ये संसाधन हैं, लेकिन मॉडल के ethical use और bias से जुड़े मुद्दे अब भी महत्वपूर्ण विचारणीय पहलू हैं।
  • Meta का Llama 3 मॉडल दूसरे open source मॉडलों से कैसे अलग होगा, और यह कौन-सी नई क्षमताएँ या innovation देगा, यह अभी स्पष्ट नहीं है। यह तकनीकी समुदाय में दिलचस्प चर्चा का विषय बन सकता है।
  • open source मॉडलों की रिलीज़ तकनीक के लोकतंत्रीकरण को बढ़ावा देती है और अधिक innovation को संभव बनाती है। हालांकि, जैसे-जैसे इन मॉडलों का प्रभाव बढ़ता है, misinformation के प्रसार, copyright infringement, और privacy से जुड़ी चिंताएँ भी बढ़ रही हैं।

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.