Llama-OCR: दस्तावेज़ों को Markdown में बदलने की तकनीक
(llamaocr.com)-
प्रोजेक्ट परिचय
- यह प्रोजेक्ट
llama-ocrऔरTogether AIOCRका उपयोग करके इमेज को संरचित Markdown में बदलने वाला एक टूल है. - उपयोगकर्ता इमेज अपलोड करके टेक्स्ट निकाल सकते हैं और उसे Markdown फ़ॉर्मेट में बदल सकते हैं.
- यह प्रोजेक्ट
-
मुख्य फीचर्स
- इमेज अपलोड फीचर उपलब्ध
- इमेज से टेक्स्ट निकालकर Markdown में बदलना
- उदाहरण इमेज उपलब्ध कराई जाती हैं ताकि उपयोगकर्ता फीचर्स को टेस्ट कर सकें
-
कोड उदाहरण
llama-ocrलाइब्रेरी का उपयोग करके इमेज से टेक्स्ट निकालने का कोड उदाहरण उपलब्धocrफ़ंक्शन में इमेज फ़ाइल पाथ और API key देकर Markdown तैयार किया जाता है
-
प्रोजेक्ट का महत्व
- यह प्रोजेक्ट इमेज से टेक्स्ट आसानी से निकालकर उसे Markdown में बदलने की सुविधा देता है, जिससे दस्तावेज़ कार्य की दक्षता बढ़ती है.
- मौजूदा OCR टूल्स की तुलना में यह आसान उपयोग और Markdown कन्वर्ज़न फीचर प्रदान करता है.
1 टिप्पणियां
Hacker News की राय
llama-ocr के लेखक ने एक साधारण API के साथ इमेज को structured Markdown में बदलने वाला टूल बनाया है। आगे PDF parsing और JSON output फीचर जोड़ने की योजना है
llama3.2-vision का उपयोग करके charity auction की bid sheets प्रोसेस की गईं, और खराब handwriting होने पर भी यह काफ़ी सटीक था
सामान्य OCR मॉडल family photos के टेक्स्ट को digitize करने के लिए उपयुक्त नहीं हैं, और Gemini Flash सबसे बेहतर था
यह "Show HN" पोस्ट के रूप में उपयुक्त है या नहीं, इस पर संदेह है, और Llama नाम से इसका संबंध कमज़ोर लगता है
genetic algorithm से बनाए गए वाक्यों को वास्तव में वृत्त में खींचा गया, लेकिन उन्हें टेक्स्ट के रूप में पहचाना नहीं गया
multi-page PDF अपलोड किया गया, लेकिन बताया गया कि यह supported नहीं है
HN screenshot अपलोड किया गया, लेकिन Markdown code output नहीं हुआ
ChatGPT API के ज़रिए जापानी OCR अच्छी तरह काम करता है
Walmart रसीद में अंक 9 को 0 के रूप में गलत पहचाना गया