pdfsandwich - इमेज और OCR को सैंडविच करके PDF फ़ाइल बनाने का टूल
(tobias-elze.de)<p>- "sandwich" PDF : केवल इमेज वाली PDF फ़ाइल पर OCR करके हर पेज की इमेज के पीछे टेक्स्ट को अदृश्य रूप से डालने वाली फ़ाइल<br />
→ टेक्स्ट को खोजा जा सकता है और चुनकर कॉपी किया जा सकता है<br />
- स्कैन की गई किताबों या मैगज़ीन पर OCR करने के लिए इस्तेमाल होने वाला कमांड लाइन टूल<br />
→ मल्टी-कॉलम टेक्स्ट भी सपोर्ट करता है <br />
- tesseract + unpaper + convert + ghostscript <br />
→ tesseract जिन भाषाओं को सपोर्ट करता है, उन सभी को सपोर्ट करता है, जिनमें Korean भी शामिल है<br />
- Linux/Mac. मल्टी-प्रोसेसर सिस्टम में parallel processing सपोर्ट </p>
अभी कोई टिप्पणी नहीं है.