- 1991 में स्थापित अग्रणी preprint server ArXiv.org 1 जुलाई से Cornell University से स्वतंत्र एक non-profit संस्था में परिवर्तित होगा
- स्वतंत्र होने के बाद यह donor base का विस्तार और technical staff बढ़ाने पर काम करेगा, ताकि सालाना लगभग 3 लाख तक पहुँच रही तेज़ी से बढ़ती paper submission और AI से बने निम्न-गुणवत्ता वाले शोधपत्रों (AI slop) की समस्या से निपटा जा सके
- पिछले 2 वर्षों में operating deficit और 50% बढ़ी submission volume के कारण वित्तीय दबाव बढ़ा है; Cornell ने 2025 में 297,000 डॉलर के घाटे की भरपाई और 819,000 डॉलर मूल्य का in-kind support दिया
- संस्थापक Paul Ginsparg ने कहा कि विश्वविद्यालयों के लिए दीर्घकालिक वैश्विक research infrastructure को बनाए रखना कठिन होता है, और sustainability सुनिश्चित करने के लिए स्वतंत्रता आवश्यक है
- यह कदम bioRxiv·medRxiv की स्वतंत्रता के उदाहरण जैसा है, और ArXiv शुरुआती वित्तीय स्थिरता के साथ शुरुआत कर रहा है, जिससे आने वाले कुछ वर्षों के संचालन के लिए धन उपलब्ध है
ArXiv का स्वतंत्र होने का निर्णय
- ArXiv.org ने 1991 में वैज्ञानिक शोधपत्रों के तेज़ और मुफ़्त preprint प्रकाशन प्लेटफ़ॉर्म के रूप में शुरुआत की थी, और 20 से अधिक वर्षों तक इसे Cornell University ने host किया
- 1 जुलाई से यह एक स्वतंत्र non-profit संस्था में बदलेगा, और नया संगठन अपने chief executive officer (CEO) की तलाश कर रहा है
- Cornell Tech के उप-डीन Greg Morrisett के अनुसार, स्वतंत्रता से अधिक विविध donors लाने और technical infrastructure बढ़ाने में मदद मिलेगी
- इस वर्ष 3 लाख से अधिक preprint प्रकाशित होने की उम्मीद है
- AI द्वारा लिखे गए निम्न-गुणवत्ता वाले शोधपत्रों (AI slop) से निपटने के लिए भी धन की ज़रूरत है
वित्तीय संरचना और बढ़त का दबाव
- 2022 के बाद से submitted papers में 50% वृद्धि हुई, जिसके चलते कर्मचारियों की संख्या बढ़ाकर 27 कर दी गई
- 2025 में 297,000 डॉलर का घाटा हुआ, जिसकी भरपाई Cornell ने की
- Cornell ने साथ ही 819,000 डॉलर मूल्य का in-kind support भी दिया
- ArXiv की वार्षिक operating cost लगभग 6.7 million डॉलर है
- 270 से अधिक संस्थान वार्षिक सदस्यता शुल्क देकर ArXiv का समर्थन करते हैं
- कुछ संस्थान सालाना अधिकतम 10,000 डॉलर तक भुगतान करते हैं
- सदस्य संस्थानों को operations में भागीदारी का अधिकार और usage data तक access मिलता है
- प्रमुख समर्थकों में Simons Foundation और Schmidt Sciences शामिल हैं; दोनों ने हाल ही में technology upgrade funding दी है
स्वतंत्रता को आगे बढ़ाने की पृष्ठभूमि
- Cornell Tech के भीतर भी funding competition थी, और कुछ समूहों को Cornell के अत्यधिक प्रभाव की चिंता थी
- Morrisett, ArXiv नेतृत्व और donors ने निष्कर्ष निकाला कि funding diversification और विस्तार के लिए स्वतंत्रता सबसे अच्छा रास्ता है
- संस्थापक Paul Ginsparg ने भी स्वतंत्रता की सिफारिश की
- उनका कहना था कि विश्वविद्यालयों के पास दीर्घकालिक वैश्विक research infrastructure चलाने का पर्याप्त अनुभव नहीं है
- Cornell की software developers को नियुक्त करने की क्षमता सीमित थी, और साइट अभी भी काफ़ी साधारण रूप में बनी हुई है
- Cornell और Simons ने प्रारंभिक वित्तीय स्थिरता के लिए धन उपलब्ध कराया ताकि ArXiv बिना घाटे के शुरुआत कर सके
- अल्पकाल में membership fee बढ़ाने की कोई योजना नहीं है
अकादमिक जगत की प्रतिक्रिया और चिंताएँ
- कुछ वैज्ञानिकों ने commercialization की संभावना और नए CEO के लगभग 300,000 डॉलर वेतन को लेकर चिंता जताई
- ArXiv ने इन चिंताओं से सहमति नहीं जताई
- Ginsparg ने कहा कि वह इन चिंताओं को समझते हैं, लेकिन ArXiv का संचालन हमेशा से अस्थिर वित्तीय आधार पर रहा है
- उन्होंने इसकी तुलना 1914 की फ़िल्म Perils of Pauline से करते हुए कहा कि यह “हमेशा एक ख़तरनाक संतुलन पर” रहा है
संस्थापक Ginsparg की भूमिका और आगे की योजना
- Ginsparg अब भी Cornell में प्रोफेसर हैं और ArXiv के संचालन में शामिल हैं
- उन्होंने 35 वर्षों तक ArXiv का नेतृत्व किया है, और अब धीरे-धीरे अपनी भूमिका कम करते हुए सेवानिवृत्ति पर विचार कर रहे हैं
- नई non-profit संस्था शुरू होने के बाद भी वह शुरुआती दौर में मदद करेंगे, लेकिन लंबी अवधि में ज़िम्मेदारी उत्तराधिकारी को सौंपने की योजना है
अन्य preprint servers से तुलना
- ArXiv की स्वतंत्रता bioRxiv और medRxiv के उस उदाहरण जैसी है, जहाँ वे Cold Spring Harbor Laboratory से अलग होकर openRxiv में स्थानांतरित हुए
- तीनों प्लेटफ़ॉर्म का लक्ष्य स्वतंत्र non-profit संरचना के ज़रिए दीर्घकालिक sustainability सुनिश्चित करना है
1 टिप्पणियां
Hacker News टिप्पणियाँ
हाल में arXiv ने review papers और position papers को अस्वीकार करने की घोषणा की, तो यह इस बात का संकेत लगा कि प्लेटफ़ॉर्म धीरे-धीरे और ज़्यादा ‘opinion-driven’ होता जा रहा है
मूल रूप से arXiv एक साधारण PDF hosting service था, जिसका काम यह सुनिश्चित करना था कि पेपर औपचारिक रूप से प्रकाशित होने से पहले भी उसे उद्धृत करने लायक न्यूनतम विश्वसनीयता मिले
लेकिन समय के साथ, खासकर ML क्षेत्र में, arXiv खुद एक तरह का औपचारिक publication venue बन गया
अब मुझे लगता है कि arXiv की ताकत जितनी बढ़ती है, वह अपने मूल कार्य से उतना ही दूर जाता है। यह मानना मुश्किल है कि Cornell से अलग होना वास्तव में कार्यक्षमता सुधारने के लिए है
आधिकारिक बयान और FAQ(लिंक) में कही गई बातें सामान्य ‘reassurance language’ जैसी लगती हैं
“यूज़र किस सकारात्मक बदलाव की उम्मीद कर सकते हैं?” इस सवाल का जवाब शायद बस इतना है कि वे नकारात्मक बदलावों को सीधे देखेंगे
ML की तेज़ रफ़्तार समझ में आती है, लेकिन peer review प्रक्रिया का अपना बड़ा महत्व है। इसे पूरी तरह छोड़ने के बजाय सुधार की दिशा में जाना चाहिए
अच्छा होगा अगर arXiv जैसा प्लेटफ़ॉर्म पूरे अकादमिक जगत में सुधार को आगे बढ़ा सके
शोधकर्ता शायद न फँसें, लेकिन आम लोग आसानी से भरोसा कर लेते हैं। हाल में ऐसे दस्तावेज़ इतने बढ़ गए हैं कि arXiv का screening system ठीक से काम कर भी रहा है या नहीं, इस पर शक होता है
arXiv के नए CEO की $300k salary ज़्यादा होने की आलोचना हुई, लेकिन मेरा मानना है कि non-profit संस्था को भी सक्षम प्रतिभा चाहिए तो इतना देना पड़ सकता है
arXiv का आधिकारिक बयान यहाँ देखा जा सकता है
मुझे लगता है arXiv में filtering से ज़्यादा indexing (ranking) की समस्या हल करना महत्वपूर्ण है
जैसे web बिखरा हुआ था और Google ने PageRank से उसे व्यवस्थित किया, वैसे क्या papers के बीच citation संबंधों के आधार पर academic ranking system बनाया जा सकता है?
यह पूरी तरह रोकने के लिए नहीं, बल्कि दुरुपयोग रोकने के स्तर तक होना चाहिए। उसके अलावा user-driven ranking और tagging system ज़्यादा बेहतर लगते हैं
arXiv को mirror करना तकनीकी रूप से कठिन नहीं है। मुश्किल है यूज़रों को स्थानांतरित करना
अकादमिक दुनिया नई प्रणालियाँ अपनाने में बहुत रूढ़िवादी है, लेकिन अगर arXiv सच में इस्तेमाल लायक न रहे, तो अंततः लोग वैकल्पिक प्लेटफ़ॉर्म पर जाएँगे ही
arXiv अब भी एक साधारण PDF repository तक सीमित है, लेकिन इसमें research sharing के तरीके को बदल देने की क्षमता है
विश्वविद्यालय के प्रभाव से बाहर आना शायद अच्छी बात भी हो सकती है। लेकिन सफलता अंततः संचालन टीम की क्षमता पर निर्भर करेगी
सच कहूँ तो समझ नहीं आता कि arXiv को Cornell से अलग करने की ज़रूरत क्यों है। कोई ऐसा ‘समस्या बिंदु’ नज़र नहीं आता जिसे हल करना हो
कभी-कभी सोचता हूँ कि National Science Foundation (NSF) जैसी संस्था arXiv जैसी साइट चलाए तो कैसा हो
सत्यापित शोधकर्ता कोई भी upload कर सके, और reviewer के रूप में काम करने पर trust score मिले—ऐसी संरचना बन सकती है
arXiv का endorsement system स्वतंत्र शोधकर्ताओं के लिए बड़ा अवरोध है
अगर संस्थागत email या मौजूदा authors से जुड़ाव न हो, तो कुछ क्षेत्रों (cs.NE) में upload नहीं किया जा सकता
अगर स्वतंत्रता बढ़ानी है, तो independent researchers की accessibility भी साथ में बेहतर होनी चाहिए
Cornell सालाना tuition में $50k लेता है, यह देखें तो CEO की $300k salary कोई बहुत बड़ी रकम नहीं लगती
संबंधित वीडियो: YouTube लिंक