10 पॉइंट द्वारा GN⁺ 2025-04-23 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • arXiv 1991 में Paul Ginsparg द्वारा बनाया गया एक open access वैज्ञानिक शोधपत्र repository है, और आज भी दुनिया भर के वैज्ञानिकों के लिए सबसे महत्वपूर्ण platforms में से एक के रूप में इस्तेमाल होता है
  • इसने पारंपरिक, धीमी और महंगी academic publishing संरचना को bypass करके शोधकर्ताओं को review से पहले के (preprint) papers तुरंत साझा करने की सुविधा दी, जिससे वैज्ञानिक सहयोग और innovation को बढ़ावा मिला
  • arXiv एक साधारण automated script से शुरू हुआ था, लेकिन आज यह हर महीने 20,000 से अधिक paper submissions और 50 लाख users वाला विशाल platform बन चुका है
  • शुरुआती दौर में इसे अनौपचारिक और हल्के ढंग से चलाया गया, लेकिन बाद में इसे operational code की complexity, आंतरिक टकराव, और तकनीकी पुरानापन जैसी समस्याओं से जूझते हुए कई संकटों से गुजरना पड़ा
  • फिलहाल Simons Foundation के समर्थन और नई leadership के तहत cloud migration और Python code refactoring का काम चल रहा है, और Ginsparg अब भी quality filtering की समस्या में गहराई से लगे हुए हैं

arXiv की उत्पत्ति और वैज्ञानिक प्रकाशन व्यवस्था को चुनौती

  • भौतिक विज्ञानी Paul Ginsparg ने The Godfather की एक पंक्ति का हवाला देते हुए उस भावना को व्यक्त किया कि वे अपने बनाए platform से पूरी तरह अलग नहीं हो पा रहे
    > “Just when I thought I was out, they pull me back in!
    > “अभी लगा था कि मैं इससे निकल आया हूँ, लेकिन वे मुझे फिर वापस खींच लेते हैं!”
  • वे Cornell University में professor हैं और MacArthur Genius Grant के recipient भी हैं; 35 साल पहले उन्होंने review से पहले के (preprint) papers साझा करने के लिए digital repository arXiv विकसित किया था
  • आज भी arXiv.org का design पुराने web 1.0 style और Cornell की पहचान को बनाए रखता है, लेकिन इस सादे बाहरी रूप के विपरीत arXiv ने वैज्ञानिक ज्ञान के प्रसार की संरचना में बुनियादी बदलाव किया है
  • अगर arXiv बंद हो जाए, तो दुनिया भर के वैज्ञानिकों के काम में गंभीर बाधा आ सकती है; वास्तव में कई गणितज्ञ और भौतिक विज्ञानी arXiv पर हर दिन जाते हैं
    > “Everybody in math and physics uses it. I scan it every night.” — Scott Aaronson
    > “गणित और भौतिकी में हर कोई इसका इस्तेमाल करता है। मैं इसे हर रात देखता हूँ।”

arXiv की भूमिका और academic publishing संरचना पर सवाल

  • समाज के हर क्षेत्र में कुछ पुरानी संरचनात्मक समस्याएँ होती हैं, और academia में publishing system की अव्यवहारिकता को ऐसी ही एक बड़ी समस्या माना जाता है

  • Elsevier, Springer जैसे बड़े publishers के for-profit model की आलोचना आम तौर पर इन वजहों से की जाती है:

    • लेखकों से बिना भुगतान paper लिखवाना
    • दूसरे शोधकर्ताओं से मुफ्त में editing करवाना
    • तैयार papers को ऊँची कीमत पर बेचना, जबकि संस्थानों पर भारी subscription fee का बोझ पड़ता है
      > “Calling their practice a form of thuggery isn’t so much an insult as an economic observation.
      > “उनकी इस पद्धति को दबंगई कहना कोई अपमान नहीं, बल्कि एक आर्थिक तथ्य का बयान है।”
  • पारंपरिक peer review में कई महीने से लेकर एक साल तक लग सकते हैं, और यह धीमी प्रक्रिया जानकारी के प्रवाह में bottleneck बन जाती है

  • इसके विपरीत, arXiv paper review से पहले के चरण (preprint) में ही किसी को भी तुरंत प्रकाशित और सुलभ होने की सुविधा देकर publishing की संरचनात्मक समस्या को हल करता है

  • arXiv के मुख्य innovation को इस तरह संक्षेप में समझा जा सकता है:
    > “Showing that you could divorce the actual transmission of your results from the process of refereeing.” — Paul Fendley
    > “इसने दिखाया कि आप अपने research results के वास्तविक प्रसार को refereeing की प्रक्रिया से अलग कर सकते हैं।”

  • ऐसी संरचना ने COVID-19 pandemic जैसी संकट स्थितियों में महत्वपूर्ण वैज्ञानिक खोजों को तेजी से फैलाने में निर्णायक भूमिका निभाई

    • arXiv से प्रेरित bioRxiv, medRxiv जैसे platforms life sciences तक फैले, और यह संभावना भी जताई गई कि इससे लाखों जिंदगियाँ बची हों

arXiv की quality control संरचना

  • arXiv पर जमा किए जाने वाले papers औपचारिक peer review से नहीं गुजरते, लेकिन क्षेत्र-विशेष के experts की स्वैच्छिक समीक्षा के जरिए बुनियादी academic standards और नियम बनाए रखे जाते हैं
  • quality control के मुख्य तत्व:
    • केवल original research की अनुमति
    • manipulated data पर रोक
    • neutral language का उपयोग
  • इसके अलावा, जमा किए गए papers की automated system के जरिए प्रारंभिक जांच भी की जाती है
  • इन सत्यापन प्रक्रियाओं के बिना arXiv के pseudoscience या गैर-विशेषज्ञ submissions से भर जाने का खतरा रहता है

arXiv का प्रभाव और Ginsparg की वर्तमान भूमिका

  • 2021 में academic journal Nature ने arXiv को “10 computer codes that transformed science” में से एक चुना
    > “10 computer codes that transformed science
    > “विज्ञान को बदल देने वाले 10 computer codes”
  • arXiv की वैज्ञानिक सहयोग को बढ़ावा देने वाली भूमिका की बहुत सराहना की गई, और वर्तमान में इसके पास
    • 26 लाख से अधिक papers
    • हर महीने 20,000 नई submissions
    • मासिक 50 लाख users
  • 21वीं सदी की कई बड़ी वैज्ञानिक खोजें पहली बार arXiv के जरिए सार्वजनिक हुईं, जिनमें शामिल हैं
    • आधुनिक AI boom शुरू करने वाला “transformers” paper
    • millennium problems में से एक, Poincaré conjecture, का समाधान
  • arXiv पर आए papers बाद में प्रतिष्ठित journals में भी प्रकाशित होते हैं, लेकिन मुख्य फायदा यह है कि arXiv पर सार्वजनिक होते ही वे सभी के लिए उपलब्ध हो जाते हैं
    > “Just because a paper is posted on arXiv doesn’t mean it won’t appear in a prestigious journal someday.
    > “सिर्फ इसलिए कि कोई paper arXiv पर आ गया, इसका मतलब यह नहीं कि वह बाद में किसी प्रतिष्ठित journal में प्रकाशित नहीं होगा।”

arXiv की आंतरिक वास्तविकता और sustainability की समस्या

  • वैज्ञानिकों के लिए arXiv public library या GPS की तरह अनिवार्य माना जाता है, लेकिन वास्तविक संचालन की दृष्टि से arXiv किसी frictionless आदर्श platform से काफी दूर है
  • arXiv को अब तक इन समस्याओं का सामना करना पड़ा है:
    • bureaucratic conflict
    • पुराना पड़ चुका code
    • यहाँ तक कि जासूसी की घटनाएँ
  • Ginsparg ने इस वास्तविकता को इस तरह बयान किया:
    > “A child I sent off to college but who keeps coming back to camp out in my living room, behaving badly.
    > “यह उस बच्चे जैसा है जिसे मैंने कॉलेज भेज दिया, लेकिन वह बार-बार घर लौट आता है, मेरे drawing room में डेरा डाल देता है, और बदमाशी करता है।”
  • interview requests को FAQ की ओर मोड़ना या लोगों को सीधे आने से हतोत्साहित करना—इन सबके जरिए Ginsparg अब भी arXiv से कुछ दूरी बनाए रखने की कोशिश कर रहे हैं

Ginsparg का व्यक्तित्व, पसंद और रोजमर्रा का जीवन

  • Ithaca (जहाँ Cornell स्थित है) में हुए interview से सामने आता है कि Ginsparg
    • मजाकिया और शरारती स्वभाव के हैं
    • और साथ ही अपनी सोच को बिना समझौते लागू करने वाले जिद्दी व्यक्ति भी हैं
  • उनके पूर्व boss Geoffrey West के शब्दों में
    > “Quite a character, infamous in the community, extremely funny, a great guy.
    > “बहुत ही अलग किस्म के इंसान, community में मशहूर, बेहद मजाकिया, और शानदार व्यक्ति।”
  • Ginsparg खुद arXiv पर लिखे गए लेखों को कमतर बताते हुए कहते हैं
    > “So many articles, so few insights.
    > “लेख तो बहुत हैं, लेकिन insight बहुत कम है।”
  • 69 वर्ष की उम्र में भी वे cycling और hiking का आनंद लेने वाली सक्रिय जीवनशैली बनाए हुए हैं, और उनकी पोशाक हमेशा आरामदेह traveler style की रहती है

Ginsparg का दफ़्तर और हाल की दिलचस्पियाँ

  • Cornell के physics department का दफ़्तर “बिखरा हुआ” कम और जैसे पुराने सामान समय में ठहर गए हों, ऐसा माहौल ज़्यादा देता है
    • वहाँ 90 के दशक के parcel boxes, पुरानी magazines, CRT monitors, White House invitation जैसी चीज़ें मौजूद हैं
    • Stephen Wolfram द्वारा भेजी गई किताब में एक मज़ेदार note है

      Since you can’t find it on arXiv :)
      “क्योंकि यह आपको arXiv पर नहीं मिलेगा :)”

  • सक्रिय रूप से इस्तेमाल होने वाली लगभग एकमात्र चीज़ quantum measurement theory से जुड़े सूत्रों से भरा blackboard है
  • दफ़्तर के बाहर भी वह building की संरचना, staff की आवाजाही, यहाँ तक कि हर साल आने वाली चिड़ियों की प्रजातियों तक बारीक चीज़ों को नज़रअंदाज़ न करने वाली निरीक्षण क्षमता दिखाते हैं
  • AI papers की बाढ़ के साथ बढ़ी low-quality papers की समस्या को लेकर वह चिंतित हैं, और इन्हें छाँटने के लिए एक “holy grail crackpot filter” विकसित कर रहे हैं

    The holy grail crackpot filter.
    “सर्वोच्च सनकी-शोधपत्र फ़िल्टर”

  • arXiv की quality control के लिए वह आज भी खुद hard drive recover करते हुए language models के प्रयोग कर रहे हैं
    • इस तरह का व्यवहार arXiv की गुणवत्ता बनाए रखने की ज़िम्मेदारी को व्यक्तिगत रूप से महसूस करने वाला रवैया माना जा सकता है

arXiv का जन्म और शुरुआती इतिहास

  • arXiv मूल रूप से वैज्ञानिक अवसंरचना नहीं, बल्कि Ginsparg की NeXT machine पर चलने वाला साधारण shell scripts का एक संग्रह था, और जून 1991 में Colorado conference में मिले एक मौके से इसका जन्म हुआ
  • उस समय Princeton Institute for Advanced Study में postdoc और physics preprint mailing list चलाने वाली Joanne Cohn ने यह समस्या उठाई कि “physics papers साझा करने के लिए कोई केंद्रीकृत system नहीं है
    • affiliation या जान-पहचान के आधार पर mailing list तक पहुँच तय होती थी, और papers सार्वजनिक होने में कई महीने लगने जैसी अक्षमता मौजूद थी
  • जब एक physicist ने मज़ाक में कहा कि “यात्रा के दौरान email से आने वाले papers इतने ज़्यादा हैं कि storage भर जाती है,” तब Ginsparg को automated paper distribution system की ज़रूरत समझ आई
    • जब उन्होंने Cohn से पूछा, “क्या तुमने automation के बारे में नहीं सोचा?”, तो जवाब मिला

      Go ahead and do it yourself.
      “तो फिर तुम खुद करके देखो।”

  • अगले ही दिन Ginsparg ने सचमुच script लिखकर उसे पूरा कर दिया,

    My recollection is that the next day he’d come up with the scripts and seemed pretty happy about having done it so quickly.
    “मुझे याद है कि अगले ही दिन वह scripts लेकर आ गए थे, और उन्हें यह देखकर काफ़ी खुशी थी कि यह इतना जल्दी हो गया।” — Joanne Cohn

Ginsparg की समय-सापेक्ष स्थिति और arXiv का तकनीकी विकास

  • Ginsparg की तुलना अक्सर internet युग के Forrest Gump से की जाती है,
    • Harvard में पढ़ाई के दौरान Bill Gates और Steve Ballmer उनके batchmates थे
    • उनके भाई ने Stanford में AI pioneer Terry Winograd के साथ पढ़ाई की
    • और दोनों के पास Arpanet email accounts थे, जो उस समय बेहद दुर्लभ बात थी
  • Cornell से theoretical physics में PhD लेने के बाद उन्होंने Harvard में faculty पद से शुरुआत की, लेकिन tenure न मिलने पर Los Alamos चले गए
    • वहाँ high-energy theoretical physics research पर ही केंद्रित रह सकने वाला माहौल और sports-centered lifestyle के अनुकूल स्थानीय परिस्थितियाँ मौजूद थीं

web से पहले का arXiv system और web-आधारित विकास

  • शुरुआती दिनों में arXiv website नहीं बल्कि email autoresponder server था, और कुछ महीनों बाद इसके साथ FTP server भी चलाया गया
    • बाद में Ginsparg ने “World Wide Web” नाम की नई तकनीक के बारे में सुना और शुरुआत में

      I can’t really pay attention to every single fad.
      “मैं हर एक चलन पर ध्यान नहीं दे सकता।”
      कहते हुए संदेह जताया, लेकिन 1993 में Mosaic browser आने के बाद उनकी रुचि जगी और उन्होंने खुद web interface बना लिया

  • उनका CERN के Tim Berners-Lee से भी संपर्क था, और वे उन्हें “swordfish बहुत अच्छी तरह grill करने वाले programmer” के रूप में याद करते हैं

    Tim grilled excellent swordfish at his home in the French countryside.
    “Tim ने फ्रांस के देहाती इलाके में अपने घर पर कमाल की swordfish grill की थी।”

नाम की उत्पत्ति और codebase की सफ़ाई

  • 1994 में National Science Foundation की funding से शुरुआती shell scripts को ज़्यादा stable Perl code में refactor करने के लिए दो developers को hire किया गया
    • Mark Doyle: जो बाद में American Physical Society के CIO बने
    • Rob Hartill: जो साथ में IMDb project पर भी काम कर रहे थे, और बाद में Apache Software Foundation में भी सक्रिय रहे
  • arXiv का शुरुआती address xxx.lanl.gov था, जहाँ “xxx” का आज वाला कोई अर्थ नहीं था; बाद में पत्नी के साथ “एक बेहतर नाम” सोचते हुए Greek अक्षर chi(χ) का उपयोग कर ‘arXiv’ नाम तय किया गया

    She wrote it down and crossed out the e to make it more symmetric around the X.
    “उन्होंने इसे लिखकर देखा और ‘e’ को हटाकर इसे ‘X’ के आसपास ज़्यादा symmetrical बना दिया।”

  • शुरुआत में कोई अलग organization भी नहीं थी; 1–2 developers थे, और administrators की भूमिका ज़्यादातर परिचितों और सहकर्मियों ने निभाई, जबकि सालाना लगभग 100 papers की उम्मीद थी, लेकिन शुरुआत से ही हर महीने 100 submissions आने लगे और तेज़ी से विस्तार हुआ

community का तेज़ विस्तार और arXiv की स्थापना

  • Ginsparg के शब्दों में,

    Day one, something happened, day two something happened, day three, Ed Witten posted a paper. That was when the entire community joined.
    “पहले दिन कुछ हुआ, दूसरे दिन भी कुछ हुआ, और तीसरे दिन Ed Witten ने एक paper पोस्ट किया। उसी समय पूरी community जुड़ गई।”

  • Edward Witten आधुनिक युग के सबसे महान theoretical physicists में गिने जाते हैं और उन्हें “दुनिया का सबसे बुद्धिमान जीवित व्यक्ति” भी कहा जाता है; उन्होंने भी कहा

    The arXiv enabled much more rapid worldwide communication among physicists.
    “arXiv ने दुनिया भर के physicists के बीच संचार को बहुत अधिक तेज़ बना दिया।”

  • इसके बाद यह mathematics, computer science समेत कई क्षेत्रों में फैला, और खुद Ginsparg ने भी

    It was fun.
    “यह मज़ेदार था।”
    कहते हुए arXiv के शुरुआती development के दिनों को याद किया

arXiv का विस्तार और टकराव की शुरुआत

  • arXiv का उपयोग तेज़ी से बढ़ने पर उसे बड़े software systems में दिखने वाली scalability और operations समस्याओं का सामना करना पड़ा; खास तौर पर server slowdown और moderation burden बड़े मुद्दे बनकर उभरे
    • उदाहरण के लिए, “stanford.edu” से आए traffic surge के कारण server overload की घटना हुई थी; बाद में पता चला कि उसी दौर में Google बनाने वाले Sergey Brin और Larry Page arXiv को web crawl कर रहे थे

      Years later, when Ginsparg visited Google HQ, both Brin and Page personally apologized to him for the incident.
      “कई साल बाद, जब Ginsparg ने Google HQ का दौरा किया, तो Brin और Page ने उस घटना के लिए उनसे व्यक्तिगत रूप से माफ़ी मांगी।”

arXiv की survival strategy और publishing industry से स्वतंत्रता

  • arXiv के टिके रहने की सबसे बड़ी वजह यह थी कि उसने पारंपरिक academic publishing के स्थापित हितों वाले ढाँचे से सीधे टकराव से बचाव किया, और यह शुरुआत से अपनाई गई उस रणनीति के कारण संभव हुआ जिसमें submission के समय users से यह सहमति ली जाती थी कि “arXiv संबंधित paper को non-exclusive रूप से स्थायी तौर पर distribute कर सकता है
    • इस clause की वजह से किसी paper के दूसरे journal में छपने के बाद भी वह arXiv पर बना रह सकता था, और बड़े publishers के लिए इसे बंद करवाने की प्रेरणा कम हो गई

Los Alamos से दूरी और Cornell में वापसी

  • भले ही arXiv वैज्ञानिक समुदाय में धीरे-धीरे और अधिक महत्वपूर्ण इंफ्रास्ट्रक्चर के रूप में स्थापित हो गया था, Los Alamos प्रयोगशाला के भीतर arXiv प्रोजेक्ट को खास समर्थन नहीं मिला, बल्कि यह बात बोझ बन गई कि उसका प्रभाव प्रयोगशाला से भी बड़ा हो गया था
    • Ginsparg ने उस समय को
      > “dreamlike and heavenly” “सपने जैसा और स्वर्गिक समय”
    • कहकर व्यक्त किया, लेकिन 1999 के Wen Ho Lee जासूसी मामले के बाद प्रयोगशाला का माहौल अचानक बदल गया और सुरक्षा कड़े होने तथा मानसिक थकान बढ़ने से उन्होंने नौकरी बदलने का फैसला किया
      • उस समय प्रदर्शन मूल्यांकन में उन्हें “a strictly average performer with no particular computer skills
        → “औसत स्तर का प्रदर्शन करने वाला, और कोई खास computer skills नहीं” जैसी कड़ी आलोचना मिली, और नवजात बेटी तथा शिक्षा के माहौल की चिंता भी नौकरी बदलने के कारणों में से एक थी
  • आखिरकार Ginsparg अपनी मातृसंस्था Cornell लौट गए और arXiv भी साथ स्थानांतरित हो गया, और उन्होंने घोषणा की कि “अधिकतम 5 साल के भीतर मैं arXiv से हाथ खींच लूंगा”
    > “They disseminate material to academics, so that seemed like a natural fit.
    > “वे शिक्षाविदों तक सामग्री पहुंचाते हैं, इसलिए यह एक स्वाभाविक विकल्प लगा।”

पुस्तकालय के भीतर संचालन टकराव

  • लेकिन Cornell पुस्तकालय arXiv की तकनीकी जटिलता को ठीक से समझ नहीं पाया, जबकि केवल submission logic में ही असंख्य exception handling की जरूरत पड़ती थी, इसलिए इसे एक साधारण सामग्री-संग्रह प्रणाली की तरह देखना समस्या बन गया
  • Ginsparg और शुरुआती सदस्यों को लगा कि पुस्तकालय पक्ष arXiv को एक तरह का बाद में जुड़ा अतिरिक्त काम समझता था, जबकि दूसरी ओर पुस्तकालय पक्ष को लगा कि Ginsparg जरूरत से ज्यादा सीधे हस्तक्षेप करते हैं
    > “Good lower-level manager … but his sense of management didn’t scale.
    > “अच्छे व्यावहारिक manager थे, लेकिन उनकी management क्षमता बड़े पैमाने के संचालन के लिए उपयुक्त नहीं थी।”
  • 2000 के दशक के अधिकांश समय में, arXiv स्थिर development स्टाफ सुरक्षित किए बिना ही चलता रहा

Ginsparg के दर्शन और संचालन शैली पर आलोचना

  • Ginsparg ने अब भी खुद code review करने और errors पकड़ने वाली hands-on developer प्रवृत्ति बनाए रखी, और बाहरी व्याख्यानों या उच्च-स्तरीय advisory भूमिकाओं के प्रति निंदक रवैया दिखाया
    > “Larry Summers spending one day a week consulting for some hedge fund—it’s just unseemly.
    > “Larry Summers का हफ्ते में एक दिन किसी hedge fund के लिए consulting करना अच्छा नहीं लगता।”
  • लेकिन बहुत लंबे समय तक उनका लगातार जुड़े रहना भी समस्या बन गया, और arXiv का पैमाना लगातार बढ़ता गया
    > “bigger than all of us” — Stephanie Orphan (arXiv program director)
    > “हम सब से बड़ा हो चुका अस्तित्व”
    जैसी समझ साझा होने लगी
  • intelligent design वाले भौतिक विज्ञानी का मुकदमा, plagiarism विवाद, moderator अधिकारों के दुरुपयोग पर आलोचना जैसे कई विवाद उभरे
    • खासकर 2009 में स्वतंत्र भौतिक विज्ञानी Philip Gibbs ने arXiv के विरोधी मंच viXra की स्थापना की
      • इसे “लगभग बिना नियमन वाला ऐसा प्लेटफ़ॉर्म जो arXiv के उलटी दिशा में काम करता है” कहा गया, जहां अक्सर अजीबोगरीब सिद्धांत या शौकिया शोधपत्र दर्ज किए जाते हैं
      • प्रतिनिधि उदाहरण के तौर पर “π झूठ है” नामक शोधपत्र(लिंक) का उल्लेख किया गया

codebase प्रबंधन की समस्या और development practices का टकराव

  • arXiv धीरे-धीरे एक विशाल codebase में बदल गया, और शुरुआती संरचना maintainability और testing को ध्यान में रखे बिना बनाई गई थी, इसलिए
    • सुरक्षा निरीक्षण के बिना भवन निर्माण” जैसी संरचनात्मक समस्याएं पैदा हुईं
    • इससे शुरुआती तेज development तो संभव हुआ, लेकिन लंबी अवधि का technical debt और बढ़ती complexity भी पैदा हुई
  • Ginsparg अब भी पुस्तकालय की मंजूरी के बिना सीधे code review और बदलाव में दखल देते रहे, और इसी वजह से
    > “micromanaging and sowing distrust
    > “अत्यधिक दखलअंदाजी और अविश्वास फैलाना”
    जैसी आलोचनाओं का सामना करना पड़ा

रिटायरमेंट की कोशिश, बने रहना, और आंतरिक टकराव का बढ़ना

  • 2011 में arXiv की 20वीं वर्षगांठ पर Ginsparg ने रिटायर होने का फैसला पक्का किया, और Nature में “ArXiv at 20” शीर्षक से विदाई लेख प्रकाशित किया
    > “For me, the repository was supposed to be a three-hour tour, not a life sentence.
    > “मेरे लिए arXiv तीन घंटे की यात्रा होना था, उम्रकैद नहीं।”
    > “ArXiv was originally conceived to be fully automated, so as not to scuttle my research career.
    > “arXiv की मूल कल्पना पूरी तरह automated होने की थी, ताकि मेरा शोध करियर पटरी से न उतरे।”
    > “But daily administrative activities associated with running it can consume hours of every weekday, year-round without holiday.
    > “लेकिन इसे चलाने से जुड़े दैनिक प्रशासनिक काम हर कार्यदिवस के कई घंटे खा सकते हैं, और यह सालभर बिना छुट्टी चलता है।”
  • इसके बाद दैनिक संचालन Cornell पुस्तकालय को सौंपने और Ginsparg के advisory समिति में पीछे हटने की योजना थी, लेकिन हकीकत वैसी नहीं रही
    • कुछ कर्मचारियों ने आलोचना की कि Ginsparg code को “बंधक की तरह पकड़े हुए हैं” और GitHub या आंतरिक साझा करने से इनकार करते हैं,
    • वहीं उन्होंने इस बात पर झुंझलाहट जताई कि जो feature वे पहले एक दिन में बना लेते थे, अब उनमें कई हफ्ते लगते हैं
      > “I learned Fortran in the 1960s, and real programmers didn’t document.
      > “मैंने 1960s में Fortran सीखी थी, और असली programmers documentation नहीं करते थे।”
      (→ इसे प्रश्न पूछने वाले के लिए दिल का दौरा ला देने वाले झटके जैसी प्रतिक्रिया बताया गया)

प्रबंधन में गड़बड़ी और संरचनात्मक पुनर्गठन

  • तकनीकी समस्याओं के अलावा arXiv ने प्रशासनिक अव्यवस्था भी झेली,
    • 2019 में Cornell के भीतर arXiv का विभागीय ठिकाना computing and information science school में स्थानांतरित किया गया, लेकिन कुछ महीनों बाद फिर बदल दिया गया
    • इसके बाद commercial academic publishing का अनुभव रखने वाले एक व्यक्ति को संचालन प्रमुख बनाया गया, लेकिन वह डेढ़ साल में ही पद छोड़ गया
      > “There was disruption … it was not a good period.
      > “अव्यवस्था थी … वह अच्छा समय नहीं था।” — arXiv के एक अंदरूनी व्यक्ति
  • मोड़ 2022 में आया, जब Simons Foundation के समर्थन से बड़ी संख्या में development स्टाफ जोड़ा गया,
    • Cornell के Professor Ramin Zabih को संचालन प्रमुख नियुक्त किया गया,
    • और cloud migration तथा Python-आधारित code refactoring का काम गंभीर रूप से शुरू हुआ

व्यक्तिगत पहलू और आत्मचिंतन

  • पत्रकार के साथ इंटरव्यू के दौरान भी Ginsparg ने अपने बेटे की साइकिल ठीक की और साइकिल यात्रा के दौरान सामने वाले की stamina पर चुटकी ली, यानी उनका खिलंदड़ापन बना रहा
    • आखिरी चढ़ाई पर उन्होंने
      > “I might’ve oversold this to you.
      > “शायद मैंने यह रास्ता तुम्हें कुछ ज्यादा ही बढ़ा-चढ़ाकर बताया।”
      कहकर अपनी थकान मानी
  • कई दिनों तक चले इंटरव्यू के बाद पत्रकार ने कहा कि उनकी जिद और दृढ़ता ही arXiv के बचे रहने की वजह लगती है, जिस पर Ginsparg ने अप्रत्याशित प्रतिक्रिया दी
    > “One person’s tenacity is another person’s terrorism.
    > “एक व्यक्ति की दृढ़ता, दूसरे व्यक्ति को आतंक जैसी लग सकती है।”
  • इसके बाद उन्होंने
    > “I’ve heard that the staff occasionally felt terrorized.
    > “मैंने सुना है कि कर्मचारी कभी-कभी आतंकित महसूस करते थे।”
    यह भी स्वीकार किया

arXiv का वर्तमान और भविष्य

  • वर्तमान में arXiv अब भी नाटकीय ढंग से संचालित होता आ रहा है,
  • 2023 में कमरे के तापमान पर superconductors की खोज का दावा करने वाला पेपर जल्दी ही खारिज कर दिया गया, और यह arXiv के तेज़ feedback mechanism को दिखाने वाला एक उदाहरण बना
    • इसके उलट, सामान्य पेपरों को “उत्तेजक अभिव्यक्ति” या “गैर-पेशेवर भाषा” के कारण वापस लिया जाने के मामले भी हैं, जिससे “सेंसरशिप” पर विवाद भी हुआ
      • प्रतिनिधि मामला: h-index के जनक Jorge Hirsch के पेपर की वापसी

Ginsparg का मौजूदा रुख और लगाव

  • वह खुद को “open science के पायनियर” के रूप में पेश करने से दूरी बनाते हैं, और किसी भव्य मिशन से ज़्यादा arXiv को ideas के प्रयोग-स्थल के रूप में आनंद लेते हैं
    > “There are various aspects of this that remain incredibly entertaining.
    > “इस प्रोजेक्ट में अब भी कई ऐसे पहलू हैं जो बेहद मनोरंजक हैं।”
    > “I have the perfect platform for testing ideas and playing with them.
    > “मेरे पास ideas को test करने और उनके साथ खेलने के लिए एकदम सही platform है।”
  • हालांकि वह अब arXiv के ऑपरेशन code को सीधे नहीं छूते, फिर भी ‘fake paper filter’ विकसित करने वाले एक निजी प्रोजेक्ट में डूबे हुए हैं
    > “It’s like that Al Pacino quote: They keep bringing me back.
    > “यह उस Al Pacino वाले quote जैसा है: वे मुझे बार-बार वापस खींच लाते हैं।”
    > “But Al Pacino also developed a real taste for killing people.
    > “लेकिन Al Pacino को आख़िरकार लोगों को मारने का भी सचमुच चस्का लग गया था।”
    (→ arXiv के प्रति प्रेम-घृणा के रिश्ते और अपनी ही आसक्ति को हास्य के साथ व्यक्त करने वाली बात)

1 टिप्पणियां

 
GN⁺ 2025-04-23
Hacker News टिप्पणियाँ
  • यह दावा सही नहीं है कि 90 के दशक में "xxx" अभिव्यक्ति का आज वाला अर्थ नहीं था
  • यह लेख सार्वजनिक संसाधनों को बनाए रखने में आने वाली कठिनाइयों का एक सूक्ष्म उदाहरण दिखाता है, और इसका माहौल थोड़ा उदास है
    • छोटी सेवाएँ आसानी से नज़र नहीं आतीं, लेकिन महत्वपूर्ण भूमिका निभाती हैं, और उन्हें बनाए रखने के लिए मदद मिलना मुश्किल होता है
    • जब कोई सेवा बड़ी हो जाती है तो उस पर ध्यान जाता है, और उसे किसी दूसरे उद्देश्य के लिए मोड़ने की कोशिशें शुरू हो जाती हैं, जिससे मदद पाना और कठिन हो जाता है
  • वैज्ञानिकों के लिए arXiv के बिना दुनिया वैसी है जैसे सार्वजनिक पुस्तकालयों के बिना दुनिया
  • कुछ लोग Zenodo को पसंद करते हैं, क्योंकि यह CERN द्वारा होस्ट किया जाता है और अधिक फीचर देता है
  • 2021 में Nature जर्नल ने arXiv को विज्ञान को बदल देने वाले 10 प्रमुख computer code में से एक चुना था
    • यह लेख paywall के पीछे है, और सालाना $199 देकर पढ़ा जा सकता है
  • arXiv के कुछ लाइसेंस केवल non-commercial उपयोग की अनुमति देते हैं
    • किसी खास paper के मुख्य पेज पर लाइसेंस जानकारी देखने का तरीका खोजा जा रहा है
  • arXiv .ps, .tex, .pdf फ़ॉर्मैट में academic papers अपलोड करने की अनुमति देता है
  • इंटरनेट और वेब विज्ञान में सबसे परिवर्तनकारी प्लेटफ़ॉर्म हैं
  • arXiv ने एक paper रोक रखा है क्योंकि उसे विश्वास नहीं है कि computer science डिग्री के बिना किसी व्यक्ति ने अपने दम पर एक programming language विकसित की है