- जटिल दस्तावेज़ों को इंसान की तरह आसानी से विभाजित करने वाली लाइब्रेरी
- दस्तावेज़ chunking हर RAG की नींव है, लेकिन अधिकांश open source टूल्स में जटिल दस्तावेज़ों को संभालने की सीमाएँ हैं
- Open Parse इस कमी को दूर करने के लिए डिज़ाइन किया गया है। यह दस्तावेज़ लेआउट को विज़ुअली पहचानकर प्रभावी ढंग से विभाजित करने के लिए एक लचीली और उपयोग में आसान लाइब्रेरी प्रदान करता है
Open Parse की मुख्य विशेषताएँ
- विज़ुअल-आधारित (Visually-Driven) : साधारण टेक्स्ट विभाजन से आगे बढ़कर दस्तावेज़ का विज़ुअल विश्लेषण करता है, ताकि बेहतर LLM input मिल सके
- Markdown समर्थन : headings, bold, italics parsing के लिए बिल्ट-इन Markdown समर्थन
- उच्च-सटीकता table समर्थन : मौजूदा टूल्स से बेहतर सटीकता के साथ tables को साफ़ Markdown फ़ॉर्मेट में extract करता है
- विस्तारशीलता : custom post-processing स्टेप्स को आसानी से लागू किया जा सकता है
- सहज : बेहतरीन editor समर्थन और हर जगह autocomplete फीचर्स के साथ debugging समय कम करता है
- उपयोग में सरल : उपयोग और सीखने में आसान बनाने के लिए डिज़ाइन किया गया, जिससे दस्तावेज़ पढ़ने में लगने वाला समय कम होता है
अभी कोई टिप्पणी नहीं है.