- पूरी तरह मुफ़्त और open source। कोई subscription/paid features/hidden code नहीं
- चुनौतीपूर्ण पांडुलिपियों की high-quality processing से लेकर मुद्रित सामग्री की बड़े पैमाने पर full-text recognition तक, लचीले ढंग से लागू किया जा सकता है
- शक्तिशाली layout और text annotation समर्थन
- LAREX editor का उपयोग करके layout और text elements पर मैन्युअली annotation जोड़े, संशोधित करें या तुलना करें
- OCR-D ecosystem के साथ पूरी तरह compatible
- usability को ध्यान में रखकर डिज़ाइन किया गया: code/CLI का उपयोग किए बिना भी UI के ज़रिए जटिल OCR workflow बनाए जा सकते हैं
- आसान cross-platform development: OS के प्रकार की परवाह किए बिना Docker और एक command से चलाया जा सकता है
1 टिप्पणियां
Hacker News राय
जटिल segmentation pipeline कुछ साल पहले ज़रूरी थे, लेकिन अब इनमें बहुत errors आते हैं और ये model से अहम context छीन लेते हैं। handwritten text तक जाने के लिए context की ज़रूरत होती है
OCR4all शुरुआती आधुनिक मुद्रित सामग्री के digital text recovery और recognition के लिए software है
OCR4all non-technical users की ज़रूरतों को साफ़ और intuitive तरीके से संबोधित करता है
Apple का Vision Framework, Tesseract से तेज़ और ज़्यादा accurate text recognition library देता है
Tesseract और LLM को जोड़कर errors ठीक करना और formatting सुधारना, फिलहाल speed/efficiency/accuracy का सबसे अच्छा संतुलन है
AI-supported OCR API विकसित किया गया है
यह workflow ऐतिहासिक मुद्रित दस्तावेज़ों को digitize करने के लिए है
OCR4all विभिन्न open source solutions को मिलाकर automated text recognition workflow प्रदान करता है
जिज्ञासा है कि क्या यह नया SOTA OCR engine है, या फिर दूसरे जाने-पहचाने engines का उपयोग करने वाला tool है
OCR को मैं Tesseract के साथ ज़्यादातर हल हुआ मानता था, लेकिन output PDF की MRC compression के लिए कोई library या implementation ढूंढ रहा हूँ