- जापान में Sega Genesis के लिए दोबारा जारी किए गए गेम ‘Phantasy Star Fukkokuban’ को खोजते समय, वास्तव में मौजूद ही नहीं होने वाले AI-जनित झूठे लेख मिलने की घटना के आधार पर इंटरनेट पर भरोसे के टूटने पर लिखी गई पोस्ट
- सर्च रिज़ल्ट में ऊपर दिख रही साइट ने ग्राफिक्स सुधार, मौसम प्रभाव जैसी ऐसी बातें लिखीं जो पूरी तरह तथ्यहीन थीं, और बाद में पता चला कि यह Large Language Model (LLM) द्वारा गढ़ी गई कल्पना थी
- लेखक ने जब ChatGPT से उसी गेम का विवरण देने को कहा, तब भी उसने गलत platform और सामग्री बताई, जिससे training data की कमी से पैदा होने वाले hallucination को सीधे देखा गया
- इस तरह का auto-generated content SEO-उद्देश्य वाले ad sites पर बड़े पैमाने पर पहुँच रहा है, जिससे बिना सत्यापन के विश्वसनीय दिखने वाली झूठी जानकारी फैलाने वाली संरचना और मजबूत हो रही है
- नतीजतन, इंटरनेट का shared knowledge base क्षतिग्रस्त हो रहा है, और भरोसेमंद जानकारी के लिए अंततः LLM से पहले के दौर की प्रतिष्ठित sites पर ही निर्भर होना पड़ रहा है
Phantasy Star Fukkokuban का मामला
- 1994 में जापान में जारी Sega Genesis के लिए ‘Phantasy Star Fukkokuban’ मूल Master System गेम को ज्यों का त्यों शामिल करने वाला reissue संस्करण था
- कुछ Genesis consoles पर Master System गेम चल ही नहीं सकते, इसलिए वह cartridge भी काम नहीं करती
- लेखक इस गेम की रिलीज़ तारीख़ जाँचने की कोशिश कर रहा था, तभी उसे सर्च रिज़ल्ट के ऊपर झूठी जानकारी वाली साइट मिली
- संबंधित साइट ‘Press Start Gaming’ ने ग्राफिक्स सुधार, मौसम प्रभाव, दिन-रात बदलाव जैसी चीज़ों का उल्लेख किया, जबकि वास्तविक गेम में ऐसा कुछ नहीं है
- लेख का पहला वाक्य “Game data not found” था, फिर भी उसके बाद AI द्वारा बनाया गया विश्वसनीय दिखने वाला विवरण चलता रहा
Large Language Model के hallucination की समस्या
- LLM अगले token की भविष्यवाणी के आधार पर काम करते हैं, और training data में न होने वाले दुर्लभ विषयों पर विश्वसनीय लगने वाली काल्पनिक बातें बना देते हैं
- ‘Phantasy Star’ series और ‘Fukkokuban(पुनर्मुद्रित संस्करण)’ शब्द के अर्थ को जोड़कर, इसने वास्तव में मौजूद न होने वाला remake संस्करण कल्पना कर लिया
- जब लेखक ने ChatGPT से उसी गेम का विवरण माँगा, तो उसे Sega Saturn compilation के रूप में गलत पहचानने वाला जवाब मिला
- संभव है कि इसे वास्तव में मौजूद दूसरे गेम ‘Phantasy Star Collection’ के साथ भ्रमित किया गया हो
- इसी तरह, लेखक द्वारा उठाया गया एक और दुर्लभ गेम ‘Mahjong Daireikai’ भी जापानी वेब पर AI-जनित काल्पनिक विवरणों के साथ दिखाई देता है
इंटरनेट पर भरोसे का पतन
- ‘Press Start Gaming’ साइट को ad revenue के लिए बनी automated content platform माना जा रहा है
- साइट के नीचे “©2025 Cloud Gears Media” लिखा है, लेकिन किसी वास्तविक कंपनी से इसका संबंध स्पष्ट नहीं है
- ऐसी sites में तथ्य देने से ज़्यादा search exposure (SEO) को प्राथमिकता दी जाती है
- LLM के आने से झूठी जानकारी पैदा करने की लागत बहुत कम हो गई है, और बिना सत्यापन वाला content बड़े पैमाने पर फैल रहा है
- पहले कम वेतन वाले writers भी कम से कम बुनियादी तथ्य-जाँच कर लेते थे, लेकिन अब AI पूरी तरह काल्पनिक सामग्री बना रहा है
- लेखक कहता है, “अब नई sites पर भरोसा करना मुश्किल है,” और बताता है कि वह सिर्फ उन्हीं media outlets पर निर्भर हो गया है जिन्होंने AI से पहले प्रतिष्ठा बनाई थी
AI युग में सूचना पारिस्थितिकी तंत्र की क्षति
- लेखक का आकलन है कि इंटरनेट का shared knowledge (common) पहले ही ऐसी हद तक क्षतिग्रस्त हो चुका है जहाँ से लौटना मुश्किल है
- यहाँ तक कि भरोसेमंद सूचना स्रोत भी AI content से प्रदूषित होने के जोखिम में हैं
- उदाहरण के तौर पर, Ars Technica का वह मामला दिया गया है जिसमें AI-जनित उद्धरण वाला लेख प्रकाशित होने के बाद सुधारा और वापस लिया गया
- अगर LLM आगे चलकर और अधिक data को समाहित करेंगे, तो कभी न कभी उनकी सटीकता बेहतर हो सकती है, लेकिन मौजूदा नुकसान अभी से हो रहा है
- लेखक कहता है, “यह लेख सिर्फ गुस्से की भड़ास (rant) है,” लेकिन इसके ज़रिये वह इंटरनेट पर भरोसा खोने की वास्तविक अनुभूति पर ज़ोर देता है
निष्कर्ष
- AI और SEO-केंद्रित content ecosystem में जानकारी की सच्चाई से ज़्यादा उत्पादन दक्षता को प्राथमिकता दी जाती है
- परिणामस्वरूप, तथ्य-जाँच के बिना auto-generated लेख सर्च में ऊपर आने लगते हैं और यूज़र की सीखने-समझने की बुनियाद को नुकसान पहुँचाते हैं
- लेखक “इंटरनेट पर अब भरोसा नहीं किया जा सकता” कहकर लेख समाप्त करता है और संकेत देता है कि digital knowledge में भरोसा बहाल करना तत्काल ज़रूरी है
अभी कोई टिप्पणी नहीं है.