Paper to HTML - शोध-पत्रों को पढ़ने में आसान HTML में बदलना
(papertohtml.org)<p>- मशीन लर्निंग का उपयोग करके PDF, LaTeX, PubMed Central XML की सामग्री पढ़कर उसे HTML में बदलता है <br />
- उद्देश्य accessibility बढ़ाना है <br />
- AI-आधारित शोध सामग्री सर्च इंजन Semantic Scholar का एक experimental prototype <br />
- फिलहाल केवल निकाली गई images/content को cache किया जाता है, और इसका उपयोग केवल उसी दस्तावेज़ को अपलोड करने वाले व्यक्ति को तेज़ सेवा देने के लिए होता है। अपलोड की गई files को संग्रहीत नहीं किया जाता <br />
- सीमाएँ<br />
→ table को image के रूप में निकाला जाता है <br />
→ math सामग्री की accuracy कम है या वह लगभग निकाली ही नहीं जाती <br />
→ LaTeX/PubMed processing में PDF की तुलना में कुछ features कम हो सकते हैं <br />
- भविष्य में Semantic Scholar में accessibility features जोड़ने की योजना है </p>
3 टिप्पणियां