PDF2JSON - PDF को JSON में निकालने वाला टूल
(github.com)-
XPDF आधारित, C code में बनी तेज़ conversion open source library
-
Windows/Mac/Linux के लिए executable files उपलब्ध
-
फ़ॉन्ट सहित PDF के अंदर के टेक्स्ट को x,y coordinates के साथ extract करता है
1 टिप्पणियां
पहले से pdf.js का इस्तेमाल करने वाला JavaScript वर्ज़न pdf2json भी है, लेकिन यह XPDF का उपयोग करता है.
https://github.com/mozilla/pdf.js/
https://github.com/modesty/pdf2json
सामान्य PDF फीचर्स के लिए Apache PDFBox का उपयोग किया जा सकता है.
https://pdfbox.apache.org/
PDFBox एक Java लाइब्रेरी है, जिससे PDF बनाना, डेटा निकालना, विभाजित करना और मर्ज करना, तथा इमेज में कन्वर्ट करना—सब कुछ संभव है.