5 पॉइंट द्वारा GN⁺ 2026-03-21 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • 1991 में स्थापित अग्रणी preprint server ArXiv.org 1 जुलाई से Cornell University से स्वतंत्र एक non-profit संस्था में परिवर्तित होगा
  • स्वतंत्र होने के बाद यह donor base का विस्तार और technical staff बढ़ाने पर काम करेगा, ताकि सालाना लगभग 3 लाख तक पहुँच रही तेज़ी से बढ़ती paper submission और AI से बने निम्न-गुणवत्ता वाले शोधपत्रों (AI slop) की समस्या से निपटा जा सके
  • पिछले 2 वर्षों में operating deficit और 50% बढ़ी submission volume के कारण वित्तीय दबाव बढ़ा है; Cornell ने 2025 में 297,000 डॉलर के घाटे की भरपाई और 819,000 डॉलर मूल्य का in-kind support दिया
  • संस्थापक Paul Ginsparg ने कहा कि विश्वविद्यालयों के लिए दीर्घकालिक वैश्विक research infrastructure को बनाए रखना कठिन होता है, और sustainability सुनिश्चित करने के लिए स्वतंत्रता आवश्यक है
  • यह कदम bioRxiv·medRxiv की स्वतंत्रता के उदाहरण जैसा है, और ArXiv शुरुआती वित्तीय स्थिरता के साथ शुरुआत कर रहा है, जिससे आने वाले कुछ वर्षों के संचालन के लिए धन उपलब्ध है

ArXiv का स्वतंत्र होने का निर्णय

  • ArXiv.org ने 1991 में वैज्ञानिक शोधपत्रों के तेज़ और मुफ़्त preprint प्रकाशन प्लेटफ़ॉर्म के रूप में शुरुआत की थी, और 20 से अधिक वर्षों तक इसे Cornell University ने host किया
  • 1 जुलाई से यह एक स्वतंत्र non-profit संस्था में बदलेगा, और नया संगठन अपने chief executive officer (CEO) की तलाश कर रहा है
  • Cornell Tech के उप-डीन Greg Morrisett के अनुसार, स्वतंत्रता से अधिक विविध donors लाने और technical infrastructure बढ़ाने में मदद मिलेगी
    • इस वर्ष 3 लाख से अधिक preprint प्रकाशित होने की उम्मीद है
    • AI द्वारा लिखे गए निम्न-गुणवत्ता वाले शोधपत्रों (AI slop) से निपटने के लिए भी धन की ज़रूरत है

वित्तीय संरचना और बढ़त का दबाव

  • 2022 के बाद से submitted papers में 50% वृद्धि हुई, जिसके चलते कर्मचारियों की संख्या बढ़ाकर 27 कर दी गई
  • 2025 में 297,000 डॉलर का घाटा हुआ, जिसकी भरपाई Cornell ने की
    • Cornell ने साथ ही 819,000 डॉलर मूल्य का in-kind support भी दिया
    • ArXiv की वार्षिक operating cost लगभग 6.7 million डॉलर है
  • 270 से अधिक संस्थान वार्षिक सदस्यता शुल्क देकर ArXiv का समर्थन करते हैं
    • कुछ संस्थान सालाना अधिकतम 10,000 डॉलर तक भुगतान करते हैं
    • सदस्य संस्थानों को operations में भागीदारी का अधिकार और usage data तक access मिलता है
  • प्रमुख समर्थकों में Simons Foundation और Schmidt Sciences शामिल हैं; दोनों ने हाल ही में technology upgrade funding दी है

स्वतंत्रता को आगे बढ़ाने की पृष्ठभूमि

  • Cornell Tech के भीतर भी funding competition थी, और कुछ समूहों को Cornell के अत्यधिक प्रभाव की चिंता थी
  • Morrisett, ArXiv नेतृत्व और donors ने निष्कर्ष निकाला कि funding diversification और विस्तार के लिए स्वतंत्रता सबसे अच्छा रास्ता है
  • संस्थापक Paul Ginsparg ने भी स्वतंत्रता की सिफारिश की
    • उनका कहना था कि विश्वविद्यालयों के पास दीर्घकालिक वैश्विक research infrastructure चलाने का पर्याप्त अनुभव नहीं है
    • Cornell की software developers को नियुक्त करने की क्षमता सीमित थी, और साइट अभी भी काफ़ी साधारण रूप में बनी हुई है
  • Cornell और Simons ने प्रारंभिक वित्तीय स्थिरता के लिए धन उपलब्ध कराया ताकि ArXiv बिना घाटे के शुरुआत कर सके
    • अल्पकाल में membership fee बढ़ाने की कोई योजना नहीं है

अकादमिक जगत की प्रतिक्रिया और चिंताएँ

  • कुछ वैज्ञानिकों ने commercialization की संभावना और नए CEO के लगभग 300,000 डॉलर वेतन को लेकर चिंता जताई
    • ArXiv ने इन चिंताओं से सहमति नहीं जताई
  • Ginsparg ने कहा कि वह इन चिंताओं को समझते हैं, लेकिन ArXiv का संचालन हमेशा से अस्थिर वित्तीय आधार पर रहा है
    • उन्होंने इसकी तुलना 1914 की फ़िल्म Perils of Pauline से करते हुए कहा कि यह “हमेशा एक ख़तरनाक संतुलन पर” रहा है

संस्थापक Ginsparg की भूमिका और आगे की योजना

  • Ginsparg अब भी Cornell में प्रोफेसर हैं और ArXiv के संचालन में शामिल हैं
  • उन्होंने 35 वर्षों तक ArXiv का नेतृत्व किया है, और अब धीरे-धीरे अपनी भूमिका कम करते हुए सेवानिवृत्ति पर विचार कर रहे हैं
  • नई non-profit संस्था शुरू होने के बाद भी वह शुरुआती दौर में मदद करेंगे, लेकिन लंबी अवधि में ज़िम्मेदारी उत्तराधिकारी को सौंपने की योजना है

अन्य preprint servers से तुलना

  • ArXiv की स्वतंत्रता bioRxiv और medRxiv के उस उदाहरण जैसी है, जहाँ वे Cold Spring Harbor Laboratory से अलग होकर openRxiv में स्थानांतरित हुए
  • तीनों प्लेटफ़ॉर्म का लक्ष्य स्वतंत्र non-profit संरचना के ज़रिए दीर्घकालिक sustainability सुनिश्चित करना है

1 टिप्पणियां

 
GN⁺ 2026-03-21
Hacker News टिप्पणियाँ
  • हाल में arXiv ने review papers और position papers को अस्वीकार करने की घोषणा की, तो यह इस बात का संकेत लगा कि प्लेटफ़ॉर्म धीरे-धीरे और ज़्यादा ‘opinion-driven’ होता जा रहा है
    मूल रूप से arXiv एक साधारण PDF hosting service था, जिसका काम यह सुनिश्चित करना था कि पेपर औपचारिक रूप से प्रकाशित होने से पहले भी उसे उद्धृत करने लायक न्यूनतम विश्वसनीयता मिले
    लेकिन समय के साथ, खासकर ML क्षेत्र में, arXiv खुद एक तरह का औपचारिक publication venue बन गया
    अब मुझे लगता है कि arXiv की ताकत जितनी बढ़ती है, वह अपने मूल कार्य से उतना ही दूर जाता है। यह मानना मुश्किल है कि Cornell से अलग होना वास्तव में कार्यक्षमता सुधारने के लिए है
    आधिकारिक बयान और FAQ(लिंक) में कही गई बातें सामान्य ‘reassurance language’ जैसी लगती हैं
    “यूज़र किस सकारात्मक बदलाव की उम्मीद कर सकते हैं?” इस सवाल का जवाब शायद बस इतना है कि वे नकारात्मक बदलावों को सीधे देखेंगे

    • भौतिकी, खासकर सैद्धांतिक क्षेत्र में, arXiv पर ड्राफ्ट डालना, फ़ीडबैक लेना और फिर संशोधन करना बहुत पुरानी परंपरा रही है। यह सिर्फ ML की समस्या नहीं है
    • मैं भी कुछ हद तक यही सोचता हूँ। ML का उपयोग करता हूँ लेकिन मेरा मुख्य विषय नहीं है, तो बाहर से देखने पर यह टकराव दिखता है—एक तरफ वे लोग हैं जो मानते हैं कि सिर्फ arXiv ही काफ़ी है, और दूसरी तरफ वे जो अब भी औपचारिक journal publication ही असली research मानते हैं
      ML की तेज़ रफ़्तार समझ में आती है, लेकिन peer review प्रक्रिया का अपना बड़ा महत्व है। इसे पूरी तरह छोड़ने के बजाय सुधार की दिशा में जाना चाहिए
      अच्छा होगा अगर arXiv जैसा प्लेटफ़ॉर्म पूरे अकादमिक जगत में सुधार को आगे बढ़ा सके
    • “arXiv की शक्ति जितनी कम हो, वह अपना काम उतना बेहतर करता है” वाली बात ‘rule of least power’ की याद दिलाती है (Wiki लिंक)
    • जिसने publishing process को खुद झेला है, उसके नज़रिए से देखें तो पारंपरिक journal publication उच्च publication fee, असुविधाजनक UI, और बेकार reviews की वजह से लगातार थकाऊ होता जा रहा है। इसलिए arXiv पर डालकर बात खत्म कर देना बेहतर लगता है
    • आजकल arXiv पर health और supplements क्षेत्र के धोखाधड़ी वाले papers भी चढ़ रहे हैं। कुछ लोग ChatGPT से नकली paper बनाकर उसे ‘published research’ कहकर प्रचार करते हैं
      शोधकर्ता शायद न फँसें, लेकिन आम लोग आसानी से भरोसा कर लेते हैं। हाल में ऐसे दस्तावेज़ इतने बढ़ गए हैं कि arXiv का screening system ठीक से काम कर भी रहा है या नहीं, इस पर शक होता है
  • arXiv के नए CEO की $300k salary ज़्यादा होने की आलोचना हुई, लेकिन मेरा मानना है कि non-profit संस्था को भी सक्षम प्रतिभा चाहिए तो इतना देना पड़ सकता है

    • अमेरिका के बाहर से देखने पर $300k बेहद असामान्य रूप से बड़ी रकम लगती है। अमेरिका की salary structure असामान्य रूप से ऊँची है
    • arXiv के वैश्विक प्रभाव को देखें तो यह रकम उलटे कम भी लग सकती है। हाँ, बाकी कर्मचारियों की salary level को भी साथ में देखना चाहिए
    • Silicon Valley के बाहर यह निश्चित रूप से बड़ी रकम है। arXiv कोई shareholder value maximize करने वाली संस्था नहीं है, इसलिए अत्यधिक compensation की ज़रूरत नहीं होनी चाहिए
    • अगर कोई non-profit दान के पैसों से ‘आरामदायक पद’ बना रही हो, तो यह समस्या है। arXiv आखिरकार एक cloud folder ही तो है, इसलिए इतनी ऊँची salary को सही ठहराना मुश्किल है
    • CEO का ज़रूरी नहीं कि tenured professor स्तर का व्यक्ति ही हो। यह बस एक साधारण preprint repository है
  • arXiv का आधिकारिक बयान यहाँ देखा जा सकता है

    • मूल लेख से ज़्यादा अहम यही लिंक है। लेख की सामग्री CEO hiring post के आधार पर लिखी गई थी
  • मुझे लगता है arXiv में filtering से ज़्यादा indexing (ranking) की समस्या हल करना महत्वपूर्ण है
    जैसे web बिखरा हुआ था और Google ने PageRank से उसे व्यवस्थित किया, वैसे क्या papers के बीच citation संबंधों के आधार पर academic ranking system बनाया जा सकता है?

    • मैं भी यही सोचता हूँ। अगर arXiv papers को रोकने वाले journal की तरह बनने लगे, तो उसके अस्तित्व का कारण ही खत्म हो जाएगा। लेकिन अभी LLM-generated spam papers की बाढ़ को देखते हुए न्यूनतम filtering तो ज़रूरी है
      यह पूरी तरह रोकने के लिए नहीं, बल्कि दुरुपयोग रोकने के स्तर तक होना चाहिए। उसके अलावा user-driven ranking और tagging system ज़्यादा बेहतर लगते हैं
    • PageRank खुद मूल रूप से bibliometrics से प्रेरित था, लेकिन आज की academic ranking पहले से ही विकृत है। सिर्फ ranking में सुधार कर देने से समस्या हल नहीं होगी
    • संबंधित संदर्भ साइट के तौर पर readabstracted.com की सिफारिश है
  • arXiv को mirror करना तकनीकी रूप से कठिन नहीं है। मुश्किल है यूज़रों को स्थानांतरित करना
    अकादमिक दुनिया नई प्रणालियाँ अपनाने में बहुत रूढ़िवादी है, लेकिन अगर arXiv सच में इस्तेमाल लायक न रहे, तो अंततः लोग वैकल्पिक प्लेटफ़ॉर्म पर जाएँगे ही
    arXiv अब भी एक साधारण PDF repository तक सीमित है, लेकिन इसमें research sharing के तरीके को बदल देने की क्षमता है
    विश्वविद्यालय के प्रभाव से बाहर आना शायद अच्छी बात भी हो सकती है। लेकिन सफलता अंततः संचालन टीम की क्षमता पर निर्भर करेगी

  • सच कहूँ तो समझ नहीं आता कि arXiv को Cornell से अलग करने की ज़रूरत क्यों है। कोई ऐसा ‘समस्या बिंदु’ नज़र नहीं आता जिसे हल करना हो

    • लेख में वजह काफ़ी स्पष्ट लिखी है
    • छठे पैराग्राफ़ में जिस समस्या का ज़िक्र है, मुझे लगता है उसे सच में हल करने की ज़रूरत है
  • कभी-कभी सोचता हूँ कि National Science Foundation (NSF) जैसी संस्था arXiv जैसी साइट चलाए तो कैसा हो
    सत्यापित शोधकर्ता कोई भी upload कर सके, और reviewer के रूप में काम करने पर trust score मिले—ऐसी संरचना बन सकती है

    • पिछले कुछ वर्षों के science funding cuts को देखते हुए, शायद यही अच्छा है कि arXiv जैसी बुनियादी संरचना सरकार सीधे न चलाए
    • जैसे NIST CVE repository को MITRE के माध्यम से संचालित करता है, वैसे government-contracted model भी संभव है
  • arXiv का endorsement system स्वतंत्र शोधकर्ताओं के लिए बड़ा अवरोध है
    अगर संस्थागत email या मौजूदा authors से जुड़ाव न हो, तो कुछ क्षेत्रों (cs.NE) में upload नहीं किया जा सकता
    अगर स्वतंत्रता बढ़ानी है, तो independent researchers की accessibility भी साथ में बेहतर होनी चाहिए

  • Cornell सालाना tuition में $50k लेता है, यह देखें तो CEO की $300k salary कोई बहुत बड़ी रकम नहीं लगती

    • New York City के हिसाब से देखें तो $300k की वास्तविक कीमत काफ़ी कम है
    • आजकल university tuition का स्तर देखकर ही समझ आता है कि यह रकम कितनी अवास्तविक हो चुकी है
  • संबंधित वीडियो: YouTube लिंक