- GPTZero के Hallucination Check टूल ने NeurIPS 2025 के 5,290 स्वीकृत शोधपत्रों में से 4,841 का विश्लेषण कर 100 से अधिक ‘hallucinated citations’ की पुष्टि की
- कई शोधपत्रों में मौजूद ही नहीं होने वाले लेखक, गलत DOI·URL, गढ़े गए शीर्षक जैसे AI-जनित संकेत पाए गए
- GPTZero इन त्रुटियों को ‘vibe citing’ कहता है, जिसे वह वास्तविक शोधपत्र जानकारी को मिलाकर·बदलकर विश्वसनीय दिखने वाला citation बताता है
- सभी मामलों की मानव विशेषज्ञों ने जांच की, और टूल की false negative rate बहुत कम है (99% detection); इसके बजाय यह संदिग्ध मामलों को सावधानीपूर्वक चिह्नित करता है
- इसे शोधपत्र लेखन और सत्यापन प्रक्रिया में AI citation error detection automation की आवश्यकता दिखाने वाले उदाहरण के रूप में देखा जा रहा है
GPTZero के NeurIPS 2025 शोधपत्र विश्लेषण के नतीजे
- GPTZero ने NeurIPS 2025 में स्वीकृत 5,290 शोधपत्रों में से 4,841 को स्कैन कर 100 से अधिक hallucinated citations खोजे
- हर मामले की मानव सत्यापन के जरिए पुष्टि हुई कि citation वास्तव में मौजूद नहीं था
- उदाहरण के तौर पर, ऐसे कई citation मिले जिनमें अस्तित्वहीन journal नाम, लेखक नाम और DOI शामिल थे
- GPTZero इन citation त्रुटियों को AI-जनित संकेत (vibe citing) के रूप में वर्गीकृत करता है
- वास्तविक शोधपत्र शीर्षक और लेखकों को जोड़कर या बदलकर बनाए गए नकली citation इसका प्रमुख रूप हैं
- कुछ मामलों में वास्तविक शोधपत्रों जैसे शीर्षक इस्तेमाल हुए, लेकिन वर्ष·स्रोत·लेखक असंगति से उनकी पहचान हुई
‘Vibe Citing’ की परिभाषा और प्रकार
- GPTZero ‘vibe citing’ को “generative AI द्वारा वास्तविक स्रोतों को जोड़कर·बदलकर बनाया गया citation” के रूप में परिभाषित करता है
- इसमें लेखक नाम·शीर्षक·प्रकाशक·DOI को गढ़ने या मिलाकर बनाने वाले मामले शामिल हैं
- कुछ मामलों में वास्तव में मौजूद शोधपत्र का आंशिक citation किया जाता है, या नकली journal नाम बना दिए जाते हैं
- इसके विपरीत, साधारण typo·dead link·छूटे हुए page number जैसी चीजों को मानवीय त्रुटि मानकर बाहर रखा गया
- GPTZero ने वास्तविक, दोषपूर्ण और hallucinated citation के अंतर को तुलनात्मक तालिका में दिखाया
- उदाहरण: “Deep learning” शोधपत्र को “Samuel LeCun Jackson. Deep learning. Science & Nature, 2021.” में बदलने वाले मामले को hallucinated citation माना गया
Hallucination Check टूल की क्षमता
- Hallucination Check citation verification को automate करने वाला AI-आधारित detection system है
- यह ऐसे citation को अपने-आप चिह्नित करता है जिन्हें ऑनलाइन सत्यापित नहीं किया जा सकता
- यह लेखकों·संपादकों·reviewers को citation त्रुटियों की तेज़ी से समीक्षा करने में मदद करता है
- उपयोग के चरण
- लेखक submission से पहले शोधपत्र के citation की स्वतः जांच करें
- reviewer अप्रमाणित citation को जल्दी पहचानें
- conference·journal संपादकीय टीम AI Detector के साथ मिलाकर AI लेखन संकेत और citation त्रुटियां एक साथ पकड़ सकती है
GPTZero की सत्यापन सटीकता
- Hallucination Check की false negative rate बहुत कम है (99% detection accuracy)
- यानी, वास्तविक hallucinated citation छूट जाने की संभावना बेहद कम है
- हालांकि सावधानीपूर्ण detection के कारण false positive rate कुछ अधिक हो सकती है
- GPTZero ने ICLR 2026, Deloitte रिपोर्ट आदि में भी इसी तरीके से AI citation त्रुटियों के कई दर्जन मामले खोजे
अकादमिक जगत और प्रकाशन पारिस्थितिकी तंत्र के लिए महत्व
- NeurIPS 2025 का यह मामला AI टूल्स के सहारे शोधपत्र लेखन के विस्तार के साथ citation reliability में गिरावट की समस्या को उजागर करता है
- GPTZero, ICLR आयोजन समिति के साथ मिलकर भविष्य की submissions के लिए automatic paper verification system बना रहा है
- ऐसे प्रयासों से paper review की दक्षता और पारदर्शिता बढ़ने तथा AI-जनित कंटेंट के verification framework को मजबूत करने की उम्मीद है
1 टिप्पणियां
Hacker News की टिप्पणियाँ
मैंने Google में एक सहकर्मी के सह-लेखक वाले एक पेपर को रैंडम तरीके से जाँचा
जिस पेपर की ओर इशारा किया गया, वह ICLR 2024 paper था, और उसमें उद्धृत दो लेखक छूट गए थे, जबकि एक अन्य व्यक्ति (Kyle Richardson) को गलत तरीके से जोड़ दिया गया था
यह citation पेपर के मुख्य हिस्से में नहीं, बल्कि बैकग्राउंड सेक्शन में था, और इसकी काफी संभावना है कि यह AI autocomplete के दौरान हुई एक साधारण टाइपो हो
डेटासेट में गंभीर मामले भी हो सकते हैं, लेकिन मैंने जो देखा वह DOI जाँच से तुरंत सुधारा जा सकने वाला एक मामूली error था
ऐसे ‘single-error’ papers को शामिल करना मुझे लेखकों की ओर से product publicity effect को अधिकतम करने की मंशा जैसा लगता है
समस्या यह है कि यह नहीं पता चलता कि क्या यही एकमात्र गलती है
ऐसी गलती होना इस बात का संकेत है कि पेपर पर्याप्त सत्यापन के बिना submit किया गया, और यह LLM के लापरवाह इस्तेमाल का निशान है
बाकी सामग्री को verify करने के लिए domain knowledge और reproduction experiments की ज़रूरत होगी
अगर यह प्रवृत्ति फैलती है, तो research की reliability की बुनियाद हिलने का ख़तरा है
लेकिन इस मामले में वे गलत थे
reference में hallucination होना मुझे इस बात का मज़बूत संकेत लगता है कि पूरा पेपर AI से लिखा गया है
केवल DOI check से ही यह पकड़ी जा सकती थी, लेकिन अभी citation verification paper review process का core procedure नहीं है
citations को अब भी ‘narrative text’ की तरह मानने वाला trust model अब स्केल नहीं हो सकता
मैं Duke University में citation और verification process को machine-verifiable infrastructure में बदलने वाले एक project (Liberata) पर काम कर रहा हूँ
बल्कि ‘harmless cases’ को हटाना ज़्यादा भ्रामक होता
data को खुद बोलने देना अधिक ईमानदार तरीका है
लगता है कि यह घटना scientific research पर गंभीर चोट करेगी
पहले से ही data manipulation की समस्या है, और अगर LLM भरोसेमंद दिखने वाले papers बनाने लगे, तो स्थिति और खराब होगी
फिर भी, शायद इससे reproducibility को अधिक गंभीरता से लेने का मौका मिले
“पिछले साल के एक संदिग्ध paper को verify करने के लिए 2 साल और 10 लाख डॉलर चाहिए” — ऐसे proposal को funding देने वाली संस्थाएँ लगभग नहीं के बराबर हैं
science funding allocation की संरचना बदले बिना इसका समाधान मुश्किल है
papers की संख्या से मूल्यांकन करेंगे तो low-quality papers की बाढ़ आएगी, और citations से मूल्यांकन करेंगे तो सिर्फ discovery-centered research को बढ़ावा मिलेगा
replication studies को citations भी कम मिलते हैं, और जब प्रतिष्ठा व आजीविका ‘discoveries’ पर निर्भर हो, तो कोई भी replication में निवेश नहीं करता
Liberata जैसे projects publication culture को ‘novelty’ से हटाकर ‘verification और reproduction’ की ओर ले जाना चाहते हैं
अगर यह बदलाव आता है, तो मौजूदा अराजकता ज़रूरी सुधार प्रक्रिया साबित हो सकती है
उनका मानना है कि भले ही हर paper reproducible हो जाए, science की मूल समस्या हल नहीं होगी
संबंधित लेख: Replication studies can’t fix science
NeurIPS का कहना है कि hallucinated citation (reference hallucination) होने भर से पूरे paper को invalid नहीं माना जाएगा
Fortune का पूरा लेख के अनुसार, LLM का उपयोग तेज़ी से evolve हो रहा है, और 2025 में reviewers को hallucinations को mark करने के निर्देश दिए गए थे
1.1% papers में citation errors होने पर भी paper की सामग्री अपने आप invalid नहीं हो जाती — उनका यही रुख है
ऐसा लगता है जैसे सबसे harmless कारण चुनकर पूरे मुद्दे को ढकने की कोशिश की जा रही हो
science पहले ही reproducibility crisis से जूझ रहा है, और अब hallucination की समस्या भी जुड़ रही है
private companies के बढ़ते प्रभाव के बीच open science का future अंधकारमय लगता है
paper retraction से भी कोई ठोस नुकसान नहीं होता, और misconduct का expected value positive बना रहता है
incentives नहीं बदलेंगे तो स्थिति और बिगड़ेगी
LLM को citations संभालने देना आखिरकार data interpretation भी उसी पर छोड़ने की दिशा में ले जाता है, और उससे hallucinated results निकल सकते हैं
विडंबना यह है कि research papers मौजूदा research के साथ knowledge dialogue के लिए literature review शामिल करते हैं,
लेकिन LLM से citations गढ़ना ‘giants के shoulders पर खड़े होना’ नहीं, बल्कि मृगतृष्णा के shoulders पर खड़े होना है
मुझे 2024 WACV paper review में एक पूरी तरह AI द्वारा लिखा गया review मिला था
reviewer ने चार text boxes (summary, strengths, weaknesses, overall evaluation) में चार पूरी तरह अलग reviews लिख दिए थे, और वे एक-दूसरे से विरोधाभासी थे
यह स्थिति reviewer overload की वजह से है, और अधिक volunteers की ज़रूरत है
(अगर आप paper review कर सकते हैं, तो अपनी पसंदीदा conference के program chair से सीधे संपर्क करने की सलाह दी जाती है)
कुछ papers citations में ‘Firstname Lastname’, ‘John Doe’, ‘Jane Smith’ जैसे fake names डाल देते हैं और किसी को पता भी नहीं चलता
अपना पहला NeurIPS paper छापने वाले PhD छात्र के लिए आर्थिक इनाम बहुत बड़ा होता है
ज़्यादातर big tech internships में NeurIPS/ICML/ICLR first-author paper को लगभग अनिवार्य शर्त माना जाता है
एक बार यह हासिल हो जाए तो salary दो-तीन गुना तक बढ़ सकती है, और career के रास्ते खुल जाते हैं — यह कहना अतिशयोक्ति नहीं होगी
ऐसी संरचना में misconduct होना चौंकाने वाली बात नहीं है
सिर्फ एक NeurIPS paper से, बिना PhD degree के भी research role की योग्यता मिल सकती है, और 300,000 डॉलर से अधिक वेतन भी संभव है
Spotlight या Oral presentation हो तो उसकी value सात अंकों तक पहुँच सकती है
सभी सहमत लगते हैं कि मौजूदा incentive structure ही इस तरह के व्यवहार को जन्म देता है
तो क्या ‘carrot’ की जगह ‘stick’ इस्तेमाल नहीं होना चाहिए?
प्रस्ताव यह है कि LLM hallucination या data manipulation पकड़े जाने पर career ख़त्म कर देने जैसी सज़ा होनी चाहिए
AI detection tools अभी इतने भरोसेमंद नहीं हैं, और साधारण BibTeX errors या grammar correction के दौरान हुई गलतियाँ भी हो सकती हैं
मेरा मानना है कि कड़ी सज़ा तभी उचित है जब intentional misconduct साफ़ तौर पर सिद्ध हो, जैसे स्पष्ट data manipulation के मामलों में
यह विश्लेषण करना दिलचस्प होगा कि 2020 से पहले के papers में source fabrication कितनी थी
मुझे न LLM पर, न ही AI detectors पर पूरा भरोसा है
बस अब उनकी आवृत्ति तेज़ी से बढ़ गई है
citation error की समस्या तब गायब हो जाएगी जब AI search और data collection cost आज की तुलना में 100 गुना सस्ती हो जाएगी
लेकिन तब तक शायद ऐसा दौर आ जाएगा जिसमें AI द्वारा लिखे गए papers वास्तव में reality को reflect करते हैं या नहीं, यह अलग करना भी मुश्किल होगा,
यानी एक तरह का ‘stochastic mirror’ युग