StackOverflow पर प्रश्नों की संख्या में मासिक बदलाव का रुझान
(data.stackexchange.com)- StackOverflow में मासिक प्रश्न संख्या में बदलाव को विज़ुअलाइज़ करने वाला डेटा क्वेरी पेज
- सेवा के शुरुआती दौर 2008 में यह लगभग हर महीने कुछ हज़ार से 1 लाख के बीच शुरू हुआ, और 2014~2018 के दौरान लगभग 1.5~2 लाख प्रश्न दर्ज हुए; 2019 को turning point मानते हुए मासिक प्रश्न संख्या शिखर से गिरावट के रुझान में बदल गई
- 2023~2025 के बीच गिरावट की चौड़ाई और बढ़ गई, और 2025 में मासिक प्रश्न संख्या घटकर लगभग 10 हज़ार के स्तर तक पहुंच गई
- यह अपने स्वर्णकाल की तुलना में लगभग 90% से अधिक की गिरावट दर्शाता है
2 टिप्पणियां
मुझे StackOverflow का भविष्य जानने की उत्सुकता है
Hacker News की राय
मैंने पहले कभी ellipse और point के बीच की shortest distance निकालने का तरीका Stack Overflow पर पोस्ट किया था
मेरे उत्तर का लिंक
यह मेरे बनाए algorithm पर आधारित था, कुछ ही lines का code था लेकिन बहुत तेज़ी से converge करता था। मुझे लगता है कि यह मेरी ज़िंदगी का सबसे सुंदर code है
पहले इसको cite करने वाले papers भी थे, और सुना था कि Unity के collision plugin में भी इसका इस्तेमाल हुआ था। अब कोई संपर्क नहीं करता
आजकल तो यह भी नहीं पता कि इसे कहाँ पोस्ट करूँ। paper के रूप में लिखने के लिए थोड़ा अजीब है, और पहले SO ऐसी चीज़ें पोस्ट करने के लिए अच्छी जगह थी, लेकिन अब लगता है कि वह central repository ही गायब हो गई है
मैंने भी पहले SO पर EKF को singular state में जाने से रोकने की trick पोस्ट की थी, और एक professor ने उसे देखकर मुझे पहचाना था। ऐसी community की जगह लेना आसान नहीं है
भले ही posts कम हों, दुनिया को ऐसे personal blogs से भरा होना चाहिए तभी वह समृद्ध बनती है
तो फिर यह सवाल उठता है कि engineers अपनी creativity दिखाने लायक समस्याएँ कहाँ पाएँगे
यह graph देखकर मैं सच में चौंक गया। मुझे पता नहीं था कि SO इतनी तेज़ी से गिरावट में चला गया है
यह Britannica के Wikipedia आने के 9 साल बाद paper edition बंद करने से भी तेज़ है
मैं SO की समस्या को ‘कठोर moderation’ नहीं मानता। मूल कारण यह है कि लोगों को जवाब तेज़ी से पाने के लिए दूसरे रास्ते मिल गए
2016 के आसपास से Reddit search results में बार-बार दिखने लगा था, और Discord पर भी सवाल पूछो तो जवाब मिल जाता था
आख़िरी निर्णायक झटका LLM था। अब SO स्तर के जवाब तुरंत मिल जाते हैं
तो आगे LLM क्या सीखेगा? क्या वह 2014~2020 के SO data को ही बार-बार reuse करता रहेगा?
उदाहरण के लिए, भले ही API docs detailed scenarios को cover न करें, LLM कई documents को जोड़कर उत्तर बना सकता है
लेकिन Salesforce या Workday जैसे विशेष ecosystem में forums अब भी ज़्यादा उपयोगी हैं
आगे LLM यही अनुभव बड़े पैमाने पर इकट्ठा करके दोबारा बाँटने का काम करेगा
LLM के आने से SO की समस्याएँ खुलकर सामने आ गईं
सवाल अनुचित तरीके से बंद हो जाते थे, पुराने answers update नहीं होते थे, और top answerers की तानाशाही संस्कृति काफ़ी गहरी थी
इन मामलों में LLM मुझे कहीं बेहतर लगता है
public beta release (2020) के बाद से मैं इसे धीरे-धीरे ज़्यादा इस्तेमाल करने लगा
पिछले 2 हफ़्तों में मैं Spark transformation की समस्या से जूझ रहा था, लेकिन Gemini और Claude ने जो जवाब दिए वे विश्वसनीय लगते थे, पर सब गलत थे
आख़िरकार मुझे SO पर जवाब मिला और उसी की वजह से मैं Spark docs के सही हिस्से तक पहुँच पाया
LLM विनम्र है, लेकिन गलत जवाब पूरे आत्मविश्वास से बोलने वाले दोस्त जैसा है
दूसरी ओर SO असभ्य हो सकता है, लेकिन उसने सच में समस्या हल कर दी
LLM इंसानों के बीच ऐसी बहस और अनुभव की गहराई की जगह नहीं ले सकता
समय के साथ वह और सटीक होता जाएगा
मेरे मामले में LLM ने ज़्यादा accuracy दिखाई है
programming में LLM अब भी बेहद तेज़ और तुरंत प्रतिक्रिया देने वाला है
आप अतिरिक्त जानकारी दें तो वह तुरंत सुधार करता है, और समस्या पूरी तरह समझने तक दोहराता रहता है
ऊपर से कोई ताने मारने वाला भी नहीं होता
लोग इस गिरावट का दोष AI पर डालेंगे, लेकिन असल में यह community की toxicity और site की direction की समस्या थी
duplicate comment link
लेकिन एक समय ऐसा भी आ गया था जब ज़्यादातर सवालों के जवाब पहले ही दिए जा चुके थे, और Google सीधे उन्हीं जवाबों तक ले जाता था
LLM तो बस उसके ऊपर बैठा ‘आख़िरी टुकड़ा’ है
2020 CEO change and moderator council launch
मैं मानता हूँ कि SO में toxicity थी, लेकिन इसके बावजूद वह इंटरनेट के खुले ज्ञान की महान उपलब्धि था
programming को आम लोगों तक खोलने में उसका प्रभाव अब भी बहुत बड़ा है
data analyst के नज़रिए से देखें तो सवालों में कमी एक स्वाभाविक घटना है
आसान सवाल पहले ही पूछे जा चुके थे, और नए सवाल लगातार कठिन होते गए
इस graph में deleted posts शामिल नहीं हैं, इसलिए यह वास्तविकता से कम दिखता है
real data graph
यह शायद अच्छी बात भी हो सकती है। duplicate questions पूरे 20% थे, और बहुत-सी चीज़ें सिर्फ़ अच्छी search से ही हल हो सकती थीं
लेकिन Discord जैसी जगहों पर जाना बुरा है। वहाँ ज्ञान निजी हो जाता है और search नहीं किया जा सकता
फिर भी SO का data पूरी तरह खुला है, इसलिए कंपनी बंद भी हो जाए तो उसे restore किया जा सकता है
मैं 2009~2010 के शुरुआती SO दौर में बहुत सक्रिय था, लेकिन community managers के अत्यधिक हस्तक्षेप की वजह से छोड़ दिया
एक ऐसी प्रवृत्ति थी जहाँ जो लोग योगदान नहीं कर सकते थे, वे rules को हथियार बनाकर प्रभाव जमाते थे
यह हर लोकप्रिय technical community में बार-बार होता है। HN में भी थोड़ा-थोड़ा दिखता है
SO ऐसा शत्रुतापूर्ण माहौल बन गया था जहाँ सवाल पोस्ट करना भी मुश्किल था
मेरे पास 6k reputation और कई gold badges थे, फिर भी वैध सवाल अक्सर रोक दिए जाते थे
बहुत से सवाल गलत तरीके से duplicate कहकर बंद किए गए, और आख़िर में लगा कि ‘इसे बस मरने दो’
SO में ‘लोगों की मदद’ से ज़्यादा ‘data normalization’ को प्राथमिकता देने वाली culture थी
आख़िरकार वही सांस्कृतिक टकराव मुझे वहाँ से दूर ले गया