- open source AI क्रांति अभी तक नहीं हुई है
- बेशक प्रभावशाली open weights models मौजूद हैं, और weights सार्वजनिक करने वालों का धन्यवाद, लेकिन अगर आप मॉडल को पुनरुत्पादित नहीं कर सकते, तो वह वास्तविक open source नहीं है
- कल्पना कीजिए कि Linux में codebase के बिना केवल binaries जारी किए जाएँ। या यह कि codebase तो जारी किया जाए, लेकिन binaries बनाने में इस्तेमाल हुआ compiler न दिया जाए। आज की स्थिति ठीक ऐसी ही है
- इसके कई नुकसान हैं
- आप project में वापस योगदान नहीं कर सकते
- project को OSS feedback loop का लाभ नहीं मिलता
- यह सत्यापित करना कठिन है कि model में कोई backdoor (जैसे latent agent) नहीं है
- यह जाँचना संभव नहीं कि data और content filters company policies के अनुरूप हैं या नहीं
- model को refresh करने के लिए आपको company पर निर्भर रहना पड़ता है
- codebase से लेकर data pipeline तक सब कुछ सार्वजनिक रखने वाले वास्तविक open source LLM projects बहुत मूल्य और रचनात्मकता पैदा कर सकते हैं और security में सुधार कर सकते हैं
- लेकिन weights को पुनरुत्पादित करना code को compile करने जितना आसान नहीं है, इसलिए यह सरल नहीं है। इसके लिए compute capacity और know-how चाहिए
- और contributions की समीक्षा करना भी कठिन है, क्योंकि अगली training चलाने तक यह पता नहीं चलता कि उनका performance पर क्या असर होगा
- लेकिन पर्याप्त प्रेरित व्यक्ति या समूह इन बारीकियों को समझ सकते हैं, और भले ही यह मौजूदा OSS से काफी अलग दिखे, यही नई चुनौतियाँ इस क्षेत्र को दिलचस्प बनाती हैं
3 टिप्पणियां
बिलकुल सही बात,
इसलिए open source अब एक Myth या Urban Legend बनता जा रहा है। वास्तव में देखें तो इन साइटों पर सच्चे अर्थों में पूरी तरह reproducible open source model लगभग नहीं के बराबर हैं। ज़्यादातर सिर्फ marketing stunt हैं.
बात समझ में आती है, लेकिन... आजकल जो मॉडल आ रहे हैं, उनमें model training के लिए जरूरी computing power और समय ऐसा हो गया है कि किसी आम व्यक्ति के लिए उन्हें reproduce करना मुश्किल है, इसलिए इसे लेकर क्या कहना चाहिए, यह साफ़ नहीं है.
हालाँकि dataset public करने के मामले में मुझसे भी कुछ हद तक सहमति है.
Hacker News राय