कानूनी दस्तावेज़ खोजते समय यह असुविधा होती थी कि "यौन हिंसा दंड अधिनियम की धारा 14" जैसी सटीक धारा पता हो तभी उसे ढूँढा जा सके, इसलिए मैंने एक RAG डेमो बनाया है जो नागरिकों की रोज़मर्रा की भाषा में पूछने पर संबंधित प्रावधान वापस देता है।

डेटा को Ministry of Government Legislation के सार्वजनिक OpenAPI से लेकर Markdown में व्यवस्थित किया गया है, और इसे हर दिन cron से अपडेट किया जाता है।

• कानून (law-kr): 5,589
• प्रशासनिक नियम (regulate-kr): 10,765
• न्यायिक मिसालें (precedent-kr): 171,014
• कानून व्याख्या उदाहरण (interpretation-kr): 8,728
• संवैधानिक न्यायालय निर्णय उदाहरण (constitution-kr): 38,092
• स्थानीय नियम (localrule-kr): 159,910
• संधियाँ (treaty-kr): 6,907

कुल 397K+ Markdown दस्तावेज़।
प्रोडक्शन DB में 1.36M+ प्रावधान इंडेक्स किए गए हैं।

• डेमो: https://minilex.wellsa.ai
• डेटा/कोड (MIT): https://github.com/wellsa-ai
• HF Mirror: https://huggingface.co/wellsa-ai

नागरिक उपयोग के 5 परिदृश्यों (deepfake / वेतन बकाया / अनुचित बर्खास्तगी / व्यक्तिगत जानकारी का लीक / stalking) में यह स्रोत प्रावधानों के साथ उत्तर लौटाता है, यह मैंने पुष्टि की है, लेकिन सामान्यीकरण अभी बहुत दूर है।
कीवर्ड + synonym expansion पर निर्भरता अधिक है, इसलिए ranking generalization अगला काम है।

स्टैक सामान्य है: Next.js + FastAPI + Celery + PostgreSQL + pgvector, और embeddings के लिए nomic-embed-text-v2-moe(768d) इस्तेमाल कर रहा हूँ।
अपने safety sample benchmark में R@5 0.86 / MRR 0.753 के आसपास आया।

यह कानूनी सलाह का विकल्प नहीं है, बल्कि स्रोत प्रावधान खोजने में मदद करने वाला सहायक टूल है।
वास्तविक निर्णय के लिए योग्य विशेषज्ञ से सलाह लें।

फ़ीडबैक / PR स्वागत है।

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.