legalQ – कोरियाई कानूनों और न्यायिक मिसालों को प्राकृतिक भाषा में पूछने वाला सार्वजनिक चैटबॉट
(legalq.dnotitia.ai)मैं कोरियाई कानूनों और न्यायिक मिसालों के बारे में प्राकृतिक भाषा में पूछताछ करने के लिए बनाया गया सार्वजनिक चैटबॉट legalQ साझा कर रहा हूँ.
मैं Dnotitia में legalQ के विकास में भाग लेने वाला एक इंजीनियर हूँ. यह कंपनी की आधिकारिक घोषणा से अलग, GeekNews उपयोगकर्ताओं से तकनीकी फ़ीडबैक पाने के लिए अपने व्यक्तिगत अकाउंट से साझा कर रहा हूँ.
कई बार कानूनों या न्यायिक मिसालों को केवल keywords के आधार पर खोजना कठिन होता है. दूसरी ओर, अगर सीधे ChatGPT या Claude जैसे general-purpose LLM से पूछा जाए तो जवाब लेना आसान है, लेकिन धाराओं के नंबर या न्यायिक मिसालों के citation गलत हो सकते हैं.
इन समस्याओं को कम करने के लिए legalQ, RAG आधारित तरीके से काम करता है. यह उपयोगकर्ता के प्राकृतिक भाषा वाले प्रश्न को खोज के लिए उपयुक्त रूप में बदलता है, फिर संबंधित कानून और न्यायिक मिसाल डेटा खोजता है, और कोशिश करता है कि उत्तर के साथ संदर्भित धाराओं और न्यायिक मिसालों की जानकारी भी दिखाई जाए.
डेटा के लिए हाल ही में GN पर परिचित कराए गए legalize-kr का आधार लिया गया है.
फ़िलहाल नीचे बताए गए appendix डेटा की प्रोसेसिंग अभी पर्याप्त नहीं है. इसलिए जिन प्रश्नों में appendix की सामग्री मुख्य हो, उनमें केवल उत्तर को अंतिम रूप में देने के बजाय संबंधित कानूनों के लिंक साथ में दिखाने का तरीका अपनाया गया है.
मौजूदा तरीकों से अलग क्या है
- मौजूदा कानून/न्यायिक मिसाल खोज सेवाएँ
इनकी ताकत keyword search में है, लेकिन उपयोगकर्ता की स्थिति को प्राकृतिक भाषा में समझाकर प्रश्न पूछना कुछ मामलों में असुविधाजनक हो सकता है. - ChatGPT या Claude से सीधे प्रश्न
Usability अच्छी है, लेकिन धाराओं के नंबर या न्यायिक मिसालों के citation गलत हो सकते हैं. legalQ को search index के आधार पर उत्तर देने और जहाँ तक संभव हो, आधार बनने वाली धाराओं व न्यायिक मिसालों की जानकारी साथ दिखाने के लिए डिज़ाइन किया गया है. - Beommang, Korean Law MCP जैसे tools
मैंने इन्हें API या MCP layer के अधिक निकट के tools के रूप में समझा है. legalQ का लक्ष्य ऐसा UI है जिसे अलग से install किए बिना सीधे browser में इस्तेमाल किया जा सके.
स्टैक
Backend में FastAPI और frontend में React का उपयोग किया गया है. LLM call को OpenRouter के माध्यम से प्रोसेस किया जाता है, और search के लिए legalize-kr डेटा को हमारी vector DB (Seahorse Cloud) में index करके इस्तेमाल किया जाता है.
Tool call वाले हिस्से को MCP के रूप में अलग किया गया है. यह प्राकृतिक भाषा वाले प्रश्न को search query में बदलता है, आवश्यक कानून और न्यायिक मिसाल की जानकारी लाता है, और फिर उन परिणामों के आधार पर उत्तर तैयार करता है.
प्राइवेसी
कानून या न्यायिक मिसालों से जुड़े प्रश्नों में उपयोगकर्ता की ठोस परिस्थिति सामने आ सकती है, इसलिए बातचीत के संग्रहण को न्यूनतम रखने की दिशा में डिज़ाइन किया गया है.
- कोई signup या login नहीं है.
- बातचीत की सामग्री server DB में स्टोर नहीं की जाती.
- हर request पर client आवश्यक history साथ भेजता है; यह एक stateless संरचना है.
- बातचीत का history केवल browser localStorage में रहता है, और browser storage साफ़ करने पर हट जाता है.
- IP का उपयोग केवल rate limit के लिए in-memory bucket में किया जाता है.
- मानक access log का request metadata 30 दिन के rotation के आधार पर सुरक्षित रखा जाता है.
- उत्तर तैयार करने के लिए उपयोगकर्ता का query LLM API तक भेजा जा सकता है.
सीमाएँ
यह अभी शुरुआती संस्करण है, इसलिए इसकी सीमाएँ काफी हैं.
- यह कानूनी सलाह सेवा नहीं, बल्कि सामान्य कानून/न्यायिक मिसाल सूचना खोज tool है.
- उत्तर गलत हो सकता है, इसलिए महत्वपूर्ण मामलों में मूल कानून-पाठ और विशेषज्ञ समीक्षा अनिवार्य है.
- appendix डेटा को अभी पर्याप्त रूप से प्रोसेस नहीं किया जा सका है, इसलिए कभी-कभी संबंधित कानूनों के लिंक के माध्यम से मार्गदर्शन किया जाता है.
- न्यायिक मिसालों की खोज और citation, डेटा की सीमा और search quality के अनुसार छूट सकते हैं या गलत हो सकते हैं.
- ऐसे प्रश्नों में जहाँ कई कानूनों की जानकारी को साथ देखना ज़रूरी हो, tool call बढ़ जाने से उत्तर धीमा हो सकता है या कुछ जानकारी छूट सकती है.
जिन हिस्सों पर फ़ीडबैक चाहिए
यह शुरुआती सार्वजनिक रिलीज़ है, इसलिए मैं कमियों के बारे में अधिक से अधिक सुनना चाहता हूँ. खासकर नीचे जैसे फ़ीडबैक मददगार होंगे.
- किसी खास प्रश्न का उत्तर अजीब था
- धारा या न्यायिक मिसाल का citation गलत था
- संबंधित कानून ठीक से नहीं मिला
- UX में कहीं अटकाव था
- मौजूदा सेवाओं या tools की तुलना में कोई नज़रिया छूट गया है
- ऐसी अभिव्यक्तियाँ दिखती हैं जो कानूनी सलाह जैसी लगती हों और समय के साथ पुरानी पड़ सकती हों
इसे इस्तेमाल करके तीखा फ़ीडबैक दें तो मैं आभारी रहूँगा.
पढ़ने के लिए धन्यवाद.
2 टिप्पणियां
मैंने भी टैक्स क्षेत्र में इसी तरह की सेवा बनाने की कोशिश की थी, इसलिए यह देखकर अच्छा लगा.
मैंने investment tax credit से जुड़े corporate tax और Special Tax Treatment Control Act के बारे में सवाल पूछे, और यह पुष्टि की कि यह सही कानूनों और धाराओं को refer करके जवाब देता है. जवाब देते समय मूल पाठ सीधे दिखाना और जहाँ संभव हो case के हिसाब से बाँटकर समझाना प्रभावशाली लगा.
अगर आप इसे टैक्स क्षेत्र तक बढ़ाने की सोच रहे हैं, तो टैक्स क्षेत्र में आम तौर पर Ministry of Economy and Finance, National Tax Service, और Tax Tribunal आदि की administrative interpretations, tribunal precedents, rulings, और inquiry replies अधिक विस्तृत जानकारी देते हैं (आमतौर पर टैक्स संबंधी सेवाओं में ये सामग्री पहले से corpus में अनिवार्य रूप से शामिल होती है), इसलिए उस हिस्से को और बेहतर किया जाए तो यह और अच्छा होगा.
फ़ीडबैक और बहुमूल्य जानकारी के लिए धन्यवाद!
लगता है कि टैक्स वाले क्षेत्र में भी डेटा आसान नहीं है।
हम इसे बेहतर करने का तरीका खोजने की कोशिश करेंगे.