6 पॉइंट द्वारा xguru 2020-03-04 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • XPDF आधारित, C code में बनी तेज़ conversion open source library

  • Windows/Mac/Linux के लिए executable files उपलब्ध

  • फ़ॉन्ट सहित PDF के अंदर के टेक्स्ट को x,y coordinates के साथ extract करता है

1 टिप्पणियां

 
xguru 2020-03-04

पहले से pdf.js का इस्तेमाल करने वाला JavaScript वर्ज़न pdf2json भी है, लेकिन यह XPDF का उपयोग करता है.

https://github.com/mozilla/pdf.js/

https://github.com/modesty/pdf2json

सामान्य PDF फीचर्स के लिए Apache PDFBox का उपयोग किया जा सकता है.

https://pdfbox.apache.org/

PDFBox एक Java लाइब्रेरी है, जिससे PDF बनाना, डेटा निकालना, विभाजित करना और मर्ज करना, तथा इमेज में कन्वर्ट करना—सब कुछ संभव है.