- ChatGPT का युग आ चुका है। आज हम ऐसे समय में जी रहे हैं जहाँ large language models का प्रभाव इतना बड़ा है कि इसे तीसरी औद्योगिक क्रांति कहा जा सकता है। मेरी माँ भी जब किसी बात को लेकर जिज्ञासु होती हैं तो ChatGPT का उपयोग करती हैं; यानी पीढ़ियों की परवाह किए बिना इसका उपयोग-क्षेत्र लगातार और व्यापक होता जा रहा है。
- अगर सोचें कि इसका उपयोग-क्षेत्र इतना व्यापक क्यों हो रहा है, तो शायद वजह यह है कि यह उपयोगकर्ता को चाहिए वही जानकारी अपेक्षाकृत सटीक रूप से खोजकर पहुँचा देता है। जानकारी की अधिकता से थके लोगों के लिए यह 'ज़रूरी' जानकारी को अच्छी तरह छाँटकर लाता है।
- अब तक तेज़ प्रगति हुई है, लेकिन इस रास्ते में कई चुनौतियाँ भी रही हैं। उदाहरण के लिए, एक समस्या है 'hallucination'। यानी जानकारी तो मिलती है, लेकिन वह गलत या अपूर्ण रूप से सही जानकारी हो सकती है। इस घटना के कई कारण हैं। सबसे प्रमुख कारणों में से एक है उपयोगकर्ता की मंशा को गलत समझ लेना और असंबंधित जानकारी ले आना। इस समस्या का समाधान सरल दिखता है: उपयोगकर्ता की मंशा को 'अच्छी तरह' समझना और 'संबंधित' जानकारी देना।
- इसे सुधारने के लिए कई तरह के प्रयास किए जा रहे हैं। मोटे तौर पर इन्हें 4 तरीकों में बाँटा जा सकता है। 1. large language model को शुरू से बनाना, 2. पहले से 'अच्छी तरह' प्रशिक्षित large language model को लाकर इच्छित क्षेत्र के अनुरूप अतिरिक्त training देना, 3. large language model को वैसे ही इस्तेमाल करना लेकिन user query में अतिरिक्त context जोड़ना, 4. large language model को उसी रूप में रखते हुए उपयोगकर्ता को उत्तर देने की प्रक्रिया में 'संबंधित जानकारी' का context अतिरिक्त रूप से उपलब्ध कराना ताकि उसकी प्रासंगिकता उभरकर आए। जितने विविध तरीके हैं, उतने ही उनके अपने फायदे और नुकसान भी हैं।
- 1 का फायदा यह है कि शुरुआत से निर्माण करने पर डेटा का स्पष्ट context शुरू से ही large language model को दिया जा सकता है। लेकिन कमी यह है कि शुरुआत से निर्माण करने की लागत बहुत अधिक होती है।
2 का फायदा यह है कि 'अच्छी तरह' प्रशिक्षित large language model के context को आधार बनाकर domain-specific कम मात्रा के डेटा को चुनकर लागू किया जाता है, इसलिए लागत अपेक्षाकृत कम होती है और accuracy भी कुछ हद तक सुनिश्चित रहती है। लेकिन कमी यह है कि large language model के मूल context को खोए बिना domain-specific context को संतुलित रूप से बनाए रखना कठिन होता है।
3 का फायदा यह है कि user query को प्रोसेस करके मंशा के बारे में 'अच्छी तरह' context जोड़ दिया जाए तो लागत कम रहती है। लेकिन context जोड़ने की प्रक्रिया में context देने वाले की व्यक्तिपरकता शामिल हो सकती है, इसलिए context की वस्तुनिष्ठता कम हो सकती है। अगर bias बहुत अधिक परिलक्षित हो जाए, तो context सहायक होने के बजाय नकारात्मक असर डाल सकता है।
4 का फायदा यह है कि अपेक्षाकृत नवीनतम जानकारी को शामिल करते हुए user query का उत्तर दिया जा सकता है और इसे लागू करने की लागत भी कम होती है। लेकिन संबंधित दस्तावेज़ों के आधार पर प्रश्नों की गुणवत्ता बहुत अलग-अलग हो सकती है, इसलिए किन संबंधित दस्तावेज़ों को कैसे सही ढंग से पहचाना और लाया जाए, इस पर रणनीतिक रूप से काम करना पड़ता है। कई तत्वों को संतुलित रूप से मिलाना पड़ता है, इसलिए इसकी जटिलता अधिक होती है। - इसके अलावा, cost, accuracy, domain-specific terminology, up-to-date response, transparency and interpretability — इन 5 पहलुओं के आधार पर किया गया अधिक विस्तृत तुलना-विवरण https://deci.ai/blog/… में अच्छी तरह दर्ज है, इसलिए एक बार उसे देखना उपयोगी रहेगा।
- अब तक हमने large language model में उत्पन्न होने वाली hallucination समस्या को हल करने के लिए आज़माए जा रहे विभिन्न तरीकों के बारे में बात की। इस पोस्ट में हम उन तरीकों में से 4वें प्रकार, यानी 'संबंधित जानकारी' को अच्छी तरह लाकर context प्रदान करने वाली तकनीक RAG(Retrieval Augment Generation) को देखेंगे, और फिर RAG की सीमाएँ तथा उन सीमाओं को पूरक करने के तरीकों में से एक GraphRAG तक पर नज़र डालेंगे।
अभी कोई टिप्पणी नहीं है.