इंटरनेट अब मशीनों के आपस में बात करने की जगह बन गया है
- इंटरनेट लोगों के एक-दूसरे से सवाल पूछने और जवाब देने के सरल इस्तेमाल से बदलकर अब AI द्वारा बनाई गई गलत जानकारी से भरी जगह बन गया है.
- Google उपयोगकर्ताओं ने पाया कि Google गलत तरीके से बता रहा है कि अंडे पिघल सकते हैं. ऐसा इसलिए हुआ क्योंकि Google वेबसाइटों को सीधे दिखाने के बजाय पेज के स्नैपशॉट को ड्रॉपडाउन मेनू में देने लगा, जिससे उपयोगकर्ता बिना क्लिक किए ही सर्च रिज़ल्ट पढ़ सकते हैं.
- हाल के दिनों में Google Search की बेकारपन बढ़ती जा रही है; उदाहरण के लिए, chronic sinusitis खोजने पर inflamed penis से जुड़े परिणाम लौटने का मामला सामने आया.
इंटरनेट ट्रैफ़िक "लूट" और Sports Illustrated की AI लेख विवाद
- कल, एक Twitter उपयोगकर्ता ने इंटरनेट ट्रैफ़िक "लूटने" का दावा किया. उसका कहना था कि उसने प्रतिस्पर्धी वेबसाइट के site index को देखकर लेखों के URL निकाले और फिर AI का इस्तेमाल करके तेज़ी से लेख लिखे.
- साथ ही, यह भी सामने आया कि Sports Illustrated ने AI से लिखे गए लेख प्रकाशित किए और उन्हें ऐसे लोगों के नाम से छापा जो वास्तव में मौजूद ही नहीं थे. इस बारे में पूछताछ होने के बाद वह सामग्री हटा दी गई.
इंटरनेट का बुनियादी विनाश
- इंटरनेट अब लोगों के बीच संचार का मंच नहीं रहा, बल्कि मशीनों के आपस में बात करने की जगह में बदल गया है.
- "Google से पूछो" जैसी बात अब अर्थहीन होती जा रही है. गलत जानकारी या पूरी तरह गढ़ी हुई बात मिलने की संभावना बहुत बढ़ गई है.
- Sports Illustrated जैसी कंपनियाँ पाठकों को सेवा देने से अधिक Google Search परिणामों और विज्ञापन राजस्व को बढ़ाने में रुचि लेती दिखती हैं.
GN⁺ की राय
- इंटरनेट पर जानकारी की गुणवत्ता लगातार गिर रही है, जिससे उपयोगकर्ताओं में भ्रम और असुविधा बढ़ रही है.
- AI तकनीक की प्रगति से पैदा हुए दुष्प्रभावों में से एक यह है कि AI द्वारा बनाई गई गलत जानकारी के कारण भरोसेमंद जानकारी ढूंढना कठिन होता जा रहा है.
- यह बदलाव लोगों को इंटरनेट से जानकारी हासिल करने के तरीके पर फिर से सोचने के लिए मजबूर करता है और संकेत देता है कि जानकारी की गुणवत्ता सुनिश्चित करने के लिए नए दृष्टिकोण की आवश्यकता है.
1 टिप्पणियां
Hacker News राय
बड़े language models (Large Language Models, LLMs) के प्रसार से पैदा हुई समस्याओं में से एक यह है कि पहले वर्तनी या व्याकरण की गलतियों के आधार पर बेकार पोस्ट को जल्दी छांटने के लिए एक उपयोगी heuristic था, लेकिन अब AI-जनित कंटेंट की भाषा क्षमता इतनी परफेक्ट है कि वह तरीका अब काम नहीं करता। उदाहरण के लिए, curl प्रोजेक्ट में AI द्वारा बनाए गए नकली bug report की वजह से समस्या हुई थी। माना जा रहा है कि यह समस्या आगे और गंभीर होगी.
इंटरनेट में बदलाव से सहमत होते हुए भी, कुछ लोगों का मानना है कि GPT-4, 3, 2 से पहले और उसके बाद का इंटरनेट इतना अलग नहीं है। interns या भारत के virtual assistants द्वारा लिखे गए सामान्य विषयों के लेख अक्सर AI-जनित कंटेंट जितने ही खराब होते हैं और उनमें फर्क करना मुश्किल होता है। search engines का वेबपेज के टेक्स्ट और query के मेल की जगह प्रतिष्ठा के आधार पर sort करना भी एक समस्या है। लोग अब वेब की बजाय apps में रहते हैं, और वेब की गुणवत्ता लंबे समय से गिर रही है, लेकिन जल्द ही शायद यह महत्वपूर्ण भी नहीं रहेगी। अगर इंटरनेट आगे भी बना रहता है, तो उम्मीद है कि यह एक नई anonymized layer की ओर बढ़ेगा, और low-quality कंटेंट बनने को कम करने के लिए इसमें बार-बार monetary exchange की जरूरत होगी.
clearnet की मौजूदा स्थिति गंभीर होने के बीच, कुछ लोगों को यह भी लगता है कि Discord के अंदर जानकारी का अलग-थलग रहना इतना बुरा नहीं है। search engines द्वारा index न होने से यह AI कचरे के साथ दिखने या training data के रूप में इस्तेमाल होने से बच सकता है। इंटरनेट का भविष्य इंसानों पर निर्भर है, और मशीनों पर अब बुनियादी कामों के लिए भी भरोसा नहीं किया जा सकता.
BeamMP प्रोजेक्ट से AI द्वारा बनाए गए नकली bug reports और PRs (pull requests) के अनुभव साझा किए गए। ऐसे AI-जनित योगदान आसानी से पहचाने जा सकते हैं, जैसे कि वे असंबंधित code बदलते हैं या ऐसा समाधान सुझाते हैं जो compile ही नहीं होता। असली लोग आलसी होते हैं, इसलिए वे बेकार का काम नहीं करते, और AI-जनित कचरा समय की बर्बादी है, इसलिए उसे merge नहीं किया जाता.
इंटरनेट पर प्रामाणिकता बनाए रखना महत्वपूर्ण है। सिर्फ signed content ही प्रामाणिकता की गारंटी दे सकता है। ऐसी स्थिति में जहां AI और ज्यादा चीजें पोस्ट कर सकता है, filtering का एकमात्र तरीका trust और authenticity पर निर्भर करना है—यानी यह जानना कि किसने क्या पोस्ट किया है और वह क्या कह रहा है। Web of Trust की कोशिश की गई थी, लेकिन वह mainstream नहीं बन सका; हो सकता है अब उसे फिर से आजमाने का समय आ गया हो.
कुछ लोगों ने इसे LLM द्वारा तेज कर दी गई एक पुरानी समस्या बताया। Google ने ad revenue और ad tech पर अपना दबदबा बढ़ाने की कोशिश की, जिससे search results में SEO बहुत फैल गया और objective जानकारी पाना मुश्किल हो गया। जानकारी के लिए पहले Reddit पर खोज करना एक समाधान हो सकता है, लेकिन Reddit भी पिछले कुछ वर्षों में manipulated content से भर गया है.
कुछ लोगों का कहना है कि इंटरनेट पहले से ही SEO की वजह से इंसानों द्वारा बनाए गए कचरे से भरा हुआ था, इसलिए "AI" के आने से वास्तव में बहुत कुछ खोया नहीं है। ऐसे लोग भी हैं जो लंबे समय से industry में इस समस्या की ओर ध्यान दिलाते रहे हैं.
विज्ञापन आखिरकार पैसा कमाने के लिए होते हैं, और जब तक bots के पास credit cards नहीं हैं, इसका मतलब इंसानों से आने वाला पैसा ही है। Google जैसी कंपनियां, भले traffic बढ़े, अगर वह इंसानी खर्च में नहीं बदलता तो उसका असर आर्थिक रूप से महसूस करेंगी। हाल के बड़े tech layoffs इस बात का संकेत हो सकते हैं कि इस समस्या के प्रति प्रतिक्रिया शुरू हो चुकी है.
अगर आपने "Anathem" किताब पढ़ी है, तो कुछ लोगों के अनुसार हमारा काम Reticulum से कचरा छांटना है.