- हाल के समय में AI टूल्स शोध-पत्रों में गणना, methodology और references की त्रुटियाँ खोज रहे हैं
- पिछले साल, यह शोध-निष्कर्ष रिपोर्ट किया गया था कि काले प्लास्टिक के cooking utensils में cancer पैदा करने वाले chemicals शामिल हैं
- लेकिन शोध की गणितीय त्रुटि के कारण यह सामने आया कि वास्तविक chemical concentration सुरक्षित सीमा से 10 गुना कम थी
- artificial intelligence (AI) मॉडल इस त्रुटि को कुछ ही सेकंड में खोज सकता था
AI-आधारित शोध-पत्र त्रुटि-पहचान परियोजनाएँ
Black Spatula Project
- open source AI टूल से लगभग 500 papers का विश्लेषण कर त्रुटियाँ खोजी गईं
- कोलंबिया के स्वतंत्र AI researcher Joaquin Gulloso इस project का समन्वय कर रहे हैं, और इसमें 8 developers तथा सैकड़ों advisors शामिल हैं
- त्रुटियों की सूची सार्वजनिक नहीं की गई है, और त्रुटि मिलने पर researchers से सीधे संपर्क कर सुधार के लिए प्रेरित किया जा रहा है
YesNoError
- Black Spatula Project से प्रेरित होकर शुरू किया गया project
- founder और AI entrepreneur Matt Schlicht के नेतृत्व में
- dedicated cryptocurrency से funded और संचालित
- अब तक लगभग 37,000 papers का दो महीनों में विश्लेषण पूरा
- जिन papers में त्रुटियाँ मिली हैं, उन्हें website पर चिह्नित किया जाता है, लेकिन अधिकांश अभी expert verification से पहले की स्थिति में हैं
- दीर्घकाल में ResearchHub (cryptocurrency के जरिए PhD researchers को reward देने वाला platform) के साथ मिलकर त्रुटियों के verification की योजना
शोधकर्ताओं और journals को AI टूल्स के उपयोग के लिए प्रोत्साहन
- papers submit करने से पहले researchers और papers प्रकाशित करने से पहले journals को AI टूल्स से पहले ही त्रुटियाँ खोजने के लिए प्रोत्साहित किया जा रहा है
- त्रुटियों और research misconduct की रोकथाम के जरिए scientific reliability मजबूत होने की उम्मीद
अकादमिक जगत की प्रतिक्रिया और चिंताएँ
- research integrity experts ने इन projects पर सावधानीपूर्वक सकारात्मक प्रतिक्रिया दी है
- Tilburg University की researcher Michèle Nuijten ने यह चिंता जताई:
- यदि AI टूल्स की accuracy स्पष्ट रूप से verify नहीं की गई, तो गलत त्रुटि-आरोप की स्थिति में reputation को नुकसान पहुँच सकता है
- Linnaeus University के forensic metascientist James Heathers ने समर्थन में कहा:
- "खराब papers को retract करने की तुलना में उन्हें लिखना कहीं आसान है"
- AI papers को screen करने और आगे की review को प्रेरित करने में उपयोगी हो सकता है
AI टूल्स कैसे काम करते हैं
- papers में त्रुटियाँ खोजने के लिए large language model (LLM) का उपयोग
- papers से tables, images आदि की जानकारी निकालने के बाद complex commands (prompts) बनाए जाते हैं
- AI मॉडल papers का कई बार विश्लेषण कर विभिन्न प्रकार की त्रुटियाँ खोजते हैं और परिणामों का cross-verification करते हैं
- paper analysis cost: paper की लंबाई और prompt की जटिलता के अनुसार 15 cents से कुछ dollars तक
False Positive की समस्या
- Black Spatula Project → लगभग 10% false positives
- सभी त्रुटियों के लिए expert verification ज़रूरी → experts की कमी सबसे बड़ा bottleneck
- YesNoError → 10,000 papers में गणितीय त्रुटियों के 100 verified मामलों में 90% से अधिक वास्तविक त्रुटियाँ निकलीं
- YesNoError false positive rate कम करने पर काम कर रहा है और अकादमिक जगत से लगातार feedback ले रहा है
False Positive समस्या पर आलोचना
- Linnaeus University के researcher Nick Brown:
- YesNoError द्वारा विश्लेषित 40 papers में से 14 में false positives पाए गए → अधिकांश writing issues थे
- मामूली त्रुटियों के कारण अकादमिक जगत पर अनावश्यक बोझ पड़ सकता है
- "जब तक technology में बड़ा सुधार नहीं होता, तब तक स्पष्ट लाभ के बिना बहुत काम करना पड़ेगा"
AI टूल्स की आगे की चुनौतियाँ और उम्मीदें
- YesNoError ऐसी व्यवस्था लाने की योजना में है जिसमें cryptocurrency holders यह तय करेंगे कि किन papers की review प्राथमिकता से हो
- राजनीतिक रूप से संवेदनशील विषयों (जैसे climate science) के papers target बनने की संभावना है
- Brown researcher: "यदि AI टूल्स सच में प्रभावी साबित होते हैं, तो कुछ शोध क्षेत्रों में बड़ा बदलाव आ सकता है"
5 टिप्पणियां
कम-गुणवत्ता वाले शोध-पत्र तो छंट जाएंगे, लेकिन दूसरी ओर अच्छे शोध-पत्रों के लिए भी बाधाएं बढ़ने से वे तुलनात्मक रूप से कम रचनात्मक हो सकते हैं—यह चिंता होती है। तर्क में कुछ खामियां हों तब भी, उन्हीं से नए विचार पैदा होते हैं, इसलिए व्यक्तिगत रूप से मुझे यह बहुत स्वागतयोग्य नहीं लगता।
AI भी गलत हो सकता है, तो AI ने जिन बातों की ओर इशारा किया है वे गलत नहीं हैं, यह कैसे सत्यापित किया जाएगा—यह जानने की उत्सुकता है।
LLM के आम होने के साथ, उन क्षेत्रों में बहुत बड़े बदलाव आ रहे हैं जहाँ ज़्यादातर मांग सूचना की असमानता से पैदा होती थी।
सोचता हूँ कि मानवता के तरह-तरह के धर्मग्रंथों का भी विश्लेषण करवाकर देखा जाए, हाहा
Hacker News राय
अगर AI प्रकाशित शोध-पत्रों में स्पष्ट त्रुटियाँ खोज सकता है, तो इसे समीक्षा प्रक्रिया के हिस्से के रूप में इस्तेमाल किया जा सकता है। लेखक सबमिट करने से पहले अपने काम पर इसका उपयोग कर सकते हैं, जिससे पेपर की गुणवत्ता काफी बढ़ सकती है
फिलहाल YesNoError वेबसाइट में बहुत सारे false positives शामिल हैं। Linnaeus University के शोधकर्ता Nick Brown ने बताया कि 40 समस्याग्रस्त पेपरों में से 14 false positives थे
चूँकि अभी AI अगुवाई कर रहा है, लोग सोच सकते हैं कि यह धोखाधड़ी या गलत तर्क की जाँच कर रहा है। वास्तव में यह self-consistency और training data के साथ consistency की जाँच करता है
AI का उपयोग करके वापस लिए गए शोध-पत्रों के प्रभाव को मैप करने का विचार प्रस्तावित किया गया। वापस लिए गए पेपरों में उन निष्कर्षों की पहचान की जा सकती है जिन्हें अब समर्थन नहीं मिलता, और फिर देखा जा सकता है कि वे आगे के पेपरों में कहाँ दिखाई देते हैं
क्या हमारी सामूहिक स्मृति बहुत छोटी है? क्या हम AI द्वारा बनाए गए bug reports से पैदा हुई समस्याओं को भूल चुके हैं?
Black Spatula प्रोजेक्ट में प्रमुख त्रुटियाँ पकड़ने के दो उदाहरण दिए गए
यह विचार अच्छा है, और इसे अपनी कंपनी की रिपोर्टों पर लागू करके मैं स्पष्ट त्रुटियों को बॉस को भेजने से पहले पकड़ना चाहूँगा
YesNoError की योजना है कि cryptocurrency holders तय करें कि किन पेपरों की पहले समीक्षा होगी
यह विचार बहुत बुरा है। पहले सेक्शन को छोड़कर "false positives" सेक्शन पढ़ना चाहिए
इस value को लेकर बहुत संदेह है। AI "review" की वजह से पहले ही निराधार दावों का जवाब देने में समय बर्बाद हुआ है। ऐसे दावे पहले भी रहे होंगे, लेकिन text generators सही शब्दावली के साथ ऐसे hallucinate कर सकते हैं कि आम लोग और शौकिया लोग भी मान जाएँ, इसलिए उनसे निपटना और ज़्यादा झंझटभरा हो गया है