वास्तव में ओपन LLM, Hello OLMo का आगमन
(blog.allenai.org)-
AI2 ने OLMo 7B मॉडल जारी किया है। यह सही मायने में एक open source large language model है, क्योंकि इसके साथ pretraining data और training code भी सार्वजनिक किए गए हैं.
- इससे शोधकर्ता और डेवलपर सर्वश्रेष्ठ open model का उपयोग करके सामूहिक रूप से language model science को आगे बढ़ा सकते हैं.
- Meta के AI वैज्ञानिक Yann LeCun ने कहा कि open source community ही AI का भविष्य सबसे तेज़ और सबसे प्रभावी तरीके से बना सकती है.
-
OLMo framework की प्रमुख विशेषताएँ:
- पूर्ण pretraining data: इसमें AI2 का Dolma dataset उपयोग किया गया है, और training data तैयार करने वाला code भी शामिल है.
- training code और model weights: 7B scale के 4 model variants के लिए पूरे model weights, inference code, training metrics, training logs आदि उपलब्ध कराए गए हैं.
- evaluation: Catwalk project के तहत 500 से अधिक checkpoints, evaluation code और development में उपयोग किए गए evaluation tools सार्वजनिक किए गए हैं.
-
OLMo के माध्यम से AI शोधकर्ता और डेवलपर निम्नलिखित अनुभव कर सकते हैं:
- अधिक सटीक analysis: training data पर पूर्ण visibility के आधार पर वे अधिक तेज़ी से काम कर सकते हैं.
- carbon emissions में कमी: पूरे training और evaluation ecosystem को सार्वजनिक करने से duplicate development कम किया जा सकता है.
- लगातार परिणाम: model और dataset को सार्वजनिक करके पिछले models से सीखना और उन पर आगे निर्माण करना संभव होता है.
-
AMD, CSC(Lumi Supercomputer), University of Washington, Databricks आदि के साथ सहयोग के माध्यम से OLMo का विकास संभव हुआ.
GN⁺ की राय
- AI models की transparency बढ़ाने के लिए training data और code को सार्वजनिक करना बहुत महत्वपूर्ण कदम लगता है। हालांकि data bias जैसी समस्याएँ हो सकती हैं, इसलिए इस पर समीक्षा भी ज़रूरी होगी.
- open source language model ecosystem के सक्रिय होने से तकनीकी प्रगति तेज़ होने की संभावना है। लेकिन बड़े IT उद्यमों के closed AI models के साथ प्रतिस्पर्धा में यह कितना सफल होगा, यह देखना होगा.
- AI विकास के लिए आवश्यक विशाल computing resources सुनिश्चित करने में विभिन्न संस्थानों के साथ सहयोग बेहद महत्वपूर्ण दिखता है। यह academia-industry collaboration model के रूप में एक अच्छा उदाहरण बन सकता है.
- उम्मीद है कि OLMo के जरिए language models के काम करने के सिद्धांतों पर वैज्ञानिक शोध और सक्रिय होगा। इससे अधिक सुरक्षित और भरोसेमंद AI के विकास को बढ़ावा मिल सकता है.
1 टिप्पणियां
Hacker News राय
The Pileको training data में शामिल नहीं किया गया। कानूनी दृष्टि से यह अन्य "open" LLMs की तुलना में अधिक सुरक्षित हो सकता है।