14 पॉइंट द्वारा GN⁺ 2023-12-22 | 1 टिप्पणियां | WhatsApp पर शेयर करें

वैज्ञानिक अनुसंधान तक समान पहुंच

  • arXiv यह सुनिश्चित करने का प्रयास कर रहा है कि सभी उपयोगकर्ता, जिनमें दिव्यांग लोग भी शामिल हैं, वैज्ञानिक अनुसंधान तक समान रूप से पहुंच सकें.
  • 18 दिसंबर 2023 से TeX/LaTeX में सबमिट किए गए सभी पेपरों के लिए HTML फ़ॉर्मेट संस्करण बनाया जा रहा है (यह केवल उन पेपरों पर लागू है जो 1 दिसंबर के बाद सबमिट किए गए हों और जिनका HTML रूपांतरण सफल रहा हो).

HTML फ़ॉर्मेट की शुरुआत

  • HTML, PDF का विकल्प नहीं है, बल्कि arXiv उपयोगकर्ताओं को दिया जाने वाला एक अतिरिक्त फ़ॉर्मेट है.
  • सबमिटर को सबमिशन के समय PDF की तरह ही HTML संस्करण का प्रीव्यू देखने का अवसर मिलता है.
  • पेपर के abstract page पर जाने पर PDF लिंक के ठीक नीचे HTML पेपर देखने का लिंक मिल सकता है.

दिव्यांग वैज्ञानिकों के लिए बेहतर accessibility

  • दिव्यांग वैज्ञानिकों को अनुसंधान तक पहुंचने में बाधाओं का सामना करना पड़ रहा था, इसलिए HTML फ़ॉर्मेट में पेपर उपलब्ध कराने का अनुरोध किया गया था.
  • HTML फ़ॉर्मेट के पेपर screen reader जैसी तकनीकों के ज़रिए अधिक आसानी और सटीकता से पढ़े जा सकते हैं, जिससे दृष्टिबाधित, low vision, dyslexia आदि वाले शोधकर्ताओं को मदद मिलती है.

HTML रूपांतरण का experimental चरण

  • फिलहाल HTML रूपांतरण experimental चरण में है, और इसे अधिक सटीक बनाने के लिए काम जारी है.
  • सभी पेपर पूरी तरह सही ढंग से HTML में रूपांतरित नहीं होते, लेकिन accessibility की ज़रूरत वाले शोधकर्ताओं के लिए यह सुविधा यथासंभव जल्दी उपलब्ध कराने की कोशिश की गई है.
  • जिन सबमिशन का HTML रूपांतरण विफल हो जाता है, उनके सबमिशन को रोका या होल्ड पर नहीं रखा जाता, लेकिन लेखकों से HTML संस्करण को ध्यान से जाँचने का अनुरोध किया गया है.

HTML प्रोजेक्ट के लिए आभार

  • experimental HTML को विज्ञान को सभी के लिए सुलभ बनाने की दिशा में एक बड़ा कदम बताते हुए धन्यवाद दिया गया है.
  • LaTeX Project, NIST की LaTeXML टीम और arXiv के HTML पेपर प्रोजेक्ट पायलट में सहयोग करने वाले सभी लोगों का आभार व्यक्त किया गया है.
  • जो उपयोगकर्ता arXivLabs के सहयोगी प्रोजेक्ट ar5iv से परिचित हैं, उनके लिए यह HTML उपलब्धता उस प्रभावशाली प्रोजेक्ट को पूरी तरह "internalize" करने जैसा है.
  • अंतिम लक्ष्य arXiv के पूरे corpus को backfill करके सभी पेपरों के लिए HTML संस्करण उपलब्ध कराना है, लेकिन फिलहाल यह सुविधा केवल नए पेपरों के लिए दी जा रही है.
  • HTML पेपर प्रोजेक्ट के लिए bug report भेजने वाले सभी arXiv उपयोगकर्ताओं का भी धन्यवाद किया गया है, और टीम फिलहाल इन bug report का विश्लेषण कर रही है तथा नए साल में पहला सुधार कार्य करने की योजना है.

GN⁺ की राय

  • arXiv द्वारा HTML फ़ॉर्मेट उपलब्ध कराना अनुसंधान accessibility को बेहतर बनाने की दिशा में एक महत्वपूर्ण प्रगति है, और यह खास तौर पर दिव्यांग वैज्ञानिकों के लिए बहुत उपयोगी होगा.
  • इस तरह का बदलाव वैज्ञानिक समुदाय में तकनीकी बाधाओं को कम करने और अनुसंधान की समावेशिता बढ़ाने में योगदान देगा.
  • experimental चरण में होने के बावजूद, arXiv का इस सुविधा को जल्दी उपलब्ध कराने का फैसला यह दिखाता है कि वह शोधकर्ताओं की ज़रूरतों को प्राथमिकता देता है.

1 टिप्पणियां

 
GN⁺ 2023-12-22
Hacker News की राय
  • लेख में HTML उदाहरण लिंक नहीं किया गया है, लेकिन यहाँ एक मनमाना लिंक है: arXiv HTML उदाहरण लिंक. यह अच्छा है कि dark mode समर्थित है। टॉगल दिखाई नहीं देता, लेकिन यह system mode के अनुसार render होता है। इससे mobile पर arXiv की accessibility काफ़ी बेहतर होती दिख रही है.
    • HTML को शोध और अकादमिक काम के लिए accessibility और collaboration का समर्थन करने हेतु आविष्कृत हुए 30 साल से अधिक समय बाद, White House ने नई accessibility guidelines जारी कीं। यह पहली बार है कि उन्होंने PDF के बजाय HTML में कोई नई आधिकारिक policy जारी की है। White House accessibility guidelines लिंक
    • अगर आप arXiv के महत्वपूर्ण नए AI/ML papers के बारे में जानकारी पाना चाहते हैं, तो Emergent Mind देख सकते हैं। यह साइट social media पर arXiv papers के mentions को ट्रैक करती है (Hacker News, Reddit, X, YouTube, GitHub आदि), और social media activity की मात्रा तथा paper के प्रकाशित होने के समय के आधार पर papers को rank करती है। हर paper के लिए यह GPT-4 का उपयोग करके summary बनाती है, और social media discussions, paper references, तथा related papers के links देती है। यह अभी नई साइट है और ज़्यादा share नहीं हुई है। सुधार के लिए feedback या requests का स्वागत है.
    • अगर sidebar में किसी paper के लिए HTML लिंक नहीं है, तो यह जानना दिलचस्प होगा कि वह HTML में render क्यों नहीं हो रहा और इसे कैसे ठीक किया जा सकता है.
    • अच्छा होगा अगर submitters को PDF version के साथ अपना HTML version upload करने का विकल्प भी दिया जाए, सिर्फ़ automatic conversion process पर निर्भर रहने के बजाय.
      • अगर HTML version में किसी समस्या के बारे में संपर्क किया जाए, तो लेखकों के लिए यह निराशाजनक हो सकता है कि PDF में बदलाव HTML generation को प्रभावित करे, यह उम्मीद करने के अलावा उसके सुधार का कोई तरीका न हो। PDF में formatting issues को सीधे ठीक करना ज़्यादा आसान है.
      • papers के alternative formats पर प्रयोग की अनुमति देना भी दिलचस्प होगा। उदाहरण के लिए, किसी paper में एक sandbox शामिल हो जहाँ चर्चा की जा रही programming language को आज़माया जा सके, या multivariable calculus पर किसी paper में किसी function के 3D plot के साथ interact किया जा सके.
    • web पर हमेशा दांव लगाना बहुत अच्छा फ़ैसला है.
    • इस सेवा के लिए इस्तेमाल किया जाने वाला tool है arXiv-readability. कुछ clicks बचाने के लिए लिंक दे रहा हूँ.
    • text documents को render करने में PDF, HTML से काफ़ी बेहतर है। और यह फ़र्क़ काफ़ी बड़ा है। यह 10 साल पहले, बल्कि 15-20 साल पहले भी संभव था। इसका न किया जाना सिर्फ़ inertia की वजह से नहीं है। Latex और PDF में text rendering कहीं बेहतर है, और static format समय के साथ एक तय स्थिति को lock कर देता है, जो बाद में आने वालों के लिए उपयोगी होता है। HTML की मूल रूप से fluid nature के विपरीत। और फिर से कहूँ तो rendering की तुलना ही नहीं की जा सकती, और यह एक सचेत या अवचेतन quality signal भी देती है.
    • उम्मीद है कि arXiv papers को PDF format में देना बंद नहीं करेगा। मैं computer पर भी PDF पढ़ना पसंद करता हूँ.
    • जब arXiv पर बड़े PDF (100MB से ज़्यादा, जो high-resolution image generation पर केंद्रित ML papers में आम हैं) खोले जाते हैं, तो loading bar के अलावा कुछ भी render नहीं होता और 10 सेकंड से ज़्यादा का काफ़ी लंबा loading time होता है। मैं सोचता हूँ कि इस delay की वजह क्या है। क्या यह network issue है, या Chrome बड़े PDFs को render करने में सचमुच बहुत धीमा है? क्या render शुरू होने से पहले PDF का पूरी तरह download होना ज़रूरी है? जो भी हो, यही arXiv के बारे में मेरी एकमात्र शिकायत है, और ऐसे HTML documents जो document text को तुरंत load करते हुए progressively render हों, एक बड़ा सुधार होंगे.