1 पॉइंट द्वारा spilist2 2024-03-29 | 1 टिप्पणियां | WhatsApp पर शेयर करें

मैं एक media translation कंपनी में काम करता/करती हूँ, और subtitle editor प्रदान करते हैं।

editor में spellcheck फीचर है, और पूरे subtitle को text में बदलकर (टुकड़ों में काटकर) API कॉल करते हैं।

अभी हम bing API का इस्तेमाल कर रहे हैं, लेकिन इसका performance बहुत खराब है। जो पकड़ना चाहिए उसे नहीं पकड़ता, और जिसे नहीं पकड़ना चाहिए उसे पकड़ लेता है।

अब तक मैंने ये alternatives आज़माए हैं।

  • AWS spellcheck में एक कॉल पर 20 अक्षरों की सीमा है, इसलिए इसका इस्तेमाल करना बहुत मुश्किल है
  • Grammarly ने पिछले साल API support बंद कर दिया
  • https://sapling.ai/ को टेस्ट किया, लेकिन उल्टा bing की quality बेहतर लगी
  • https://rapidapi.com/collection/grammar-spellcheck-api यहाँ मौजूद चीज़ों को भी सब टेस्ट किया, लेकिन यह कहना मुश्किल था कि वे bing से खास बेहतर थीं।

ज़रूरी नहीं कि वह 'बहुभाषी' ही हो; अगर सिर्फ English भी अच्छी तरह पकड़ ले तो भी ठीक है, लेकिन अच्छे alternatives बहुत नहीं दिख रहे। सिर्फ product recommendation ही नहीं, अगर आपने spellcheck के साथ काम करने का अनुभव साझा किया हो तो भी आभारी रहूँगा/रहूँगी।

1 टिप्पणियां

 
libner 2024-04-01

https://huggingface.co/mzbac/mistral-grammar/tree/main
"बहुभाषी" शब्द पर ध्यान गया तो Mistral सीरीज़ देखते-देखते यह मिला, लेकिन यह प्रोडक्ट-लेवल की ज़रूरतों को पूरा करता है या नहीं, यह पक्का नहीं कह सकता...
लगता है कि इसे अंग्रेज़ी के लिए fine-tune किया गया है, तो क्यों न आप इस मॉडल को एक बार आज़माकर देखें