सारांश
-
बड़े भाषा मॉडल (LLM) का प्रभाव
बड़े भाषा मॉडल (LLM) में मानव-निर्मित डेटा और ज्ञान संसाधनों का विकल्प बनने की क्षमता है। लेकिन यह प्रतिस्थापन भविष्य के मॉडल विकास के लिए आवश्यक ट्रेनिंग डेटा में कमी की समस्या पैदा कर सकता है। इस अध्ययन में दस्तावेज़ित किया गया है कि ChatGPT के लॉन्च के साथ Stack Overflow की गतिविधि में गिरावट आई। -
ChatGPT का प्रभाव
ChatGPT के लॉन्च के 6 महीनों के भीतर Stack Overflow की गतिविधि, रूस और चीन के समान प्लेटफ़ॉर्म्स तथा गणित फ़ोरम्स की तुलना में 25% घट गई। इसे Stack Overflow पर ChatGPT के वास्तविक प्रभाव की निचली सीमा के रूप में समझा जाता है। सबसे अधिक उपयोग की जाने वाली प्रोग्रामिंग भाषाओं से जुड़े पोस्ट्स में गिरावट और अधिक थी। -
LLM का प्रतिस्थापन प्रभाव
LLM केवल दोहरावदार या कम-गुणवत्ता वाले कंटेंट का ही नहीं, बल्कि उच्च-गुणवत्ता वाले कंटेंट का भी स्थान ले रहे हैं। ChatGPT उपयोगकर्ताओं के Stack Overflow पर पोस्ट करने की संभावना कम होती है और वे प्लेटफ़ॉर्म पर नियमित रूप से भी नहीं आते। यह संकेत देता है कि LLM का तेज़ अपनाव, ट्रेनिंग के लिए आवश्यक सार्वजनिक डेटा के उत्पादन को कम कर सकता है, जिससे महत्वपूर्ण परिणाम सामने आ सकते हैं। -
प्रोग्रामिंग भाषाओं के अनुसार प्रभाव
Python और Javascript जैसी व्यापक रूप से उपयोग होने वाली भाषाओं में ChatGPT का प्रभाव अधिक बड़ा है। CUDA जैसी कुछ विशिष्ट भाषाओं में ChatGPT के लॉन्च के बाद पोस्ट्स बढ़े। यह दिखाता है कि AI-संबंधित सॉफ़्टवेयर में रुचि बढ़ रही है।
GN⁺ की टिप्पणी
- यह अध्ययन ChatGPT जैसे बड़े भाषा मॉडल्स का ऑनलाइन Q&A प्लेटफ़ॉर्म्स पर प्रभाव का विश्लेषण करके इस बात पर ज़ोर देता है कि AI का तेज़ अपनाव सार्वजनिक डेटा के उत्पादन पर नकारात्मक असर डाल सकता है।
- जैसे-जैसे ChatGPT का उपयोग बढ़ता है, Stack Overflow जैसे प्लेटफ़ॉर्म्स की गतिविधि घटती है, और इससे भविष्य के AI मॉडल्स के ट्रेनिंग डेटा की गुणवत्ता प्रभावित हो सकती है।
- ये बदलाव डिजिटल अर्थव्यवस्था और जानकारी तक पहुँचने के तरीकों पर महत्वपूर्ण प्रभाव डाल सकते हैं, और इससे AI ecosystem की sustainability को लेकर चिंताएँ उठती हैं।
- समान कार्यक्षमता वाले अन्य प्रोजेक्ट्स में GitHub की प्रोग्रामिंग भाषा-संबंधित repositories शामिल हैं।
1 टिप्पणियां
Hacker News राय
LLM नई जानकारी उत्पन्न नहीं करते, बल्कि मौजूदा जानकारी को फिर से संयोजित करते हैं; कोड सैंपल कम होने पर इनका प्रदर्शन कमजोर रहता है
इस दावे पर सवाल उठाया गया कि LLM सार्वजनिक ज्ञान-साझाकरण को कम कर रहे हैं
open source प्रोजेक्ट्स से जुड़े सवाल GitHub और Discord पर शिफ्ट हो रहे हैं
Stack Overflow पर मुफ़्त योगदान घटने की वजह OpenAI API कॉन्ट्रैक्ट और AI-संबंधित ब्लॉग पोस्ट बताए गए हैं
AGI तक पहुँचने पर LLM कहेंगे, "इस चैट को duplicate के रूप में चिह्नित किया गया है"
LLM ज्ञान और विमर्श के दायरे को संकीर्ण कर सकते हैं
अगर तकनीकी इंटरैक्शन कम होते हैं, तो इसका असर वास्तविक दुनिया के इंटरैक्शन पर भी पड़ सकता है
LLM ऑनलाइन Q&A प्लेटफ़ॉर्म से सीखते हैं, लेकिन अगर लोग सवाल पूछना और जवाब देना बंद कर दें, तो ज्ञान का स्रोत गलत LLM डेटा से दूषित हो सकता है
ऐसे एजेंट की ज़रूरत पड़ सकती है जो Stack Overflow में अपने-आप योगदान दे और समाधानों को अपने-आप upvote करे