मुख्य तर्क: LLM से जितनी जल्दी हो सके बाहर निकलें और उसमें ज़्यादा देर न रुकें
- LLM को decision-making या business logic नहीं सौंपना चाहिए → इसमें accuracy और stability की कमी होती है
- अधिकांश मामलों में, LLM को सिर्फ user और application API के बीच interface की भूमिका निभानी चाहिए
- core logic को dedicated system या engine में चलना चाहिए, और LLM को केवल user request को API call में बदलने और result को फिर से natural language में बदलने की भूमिका निभानी चाहिए
ऐसा क्यों?
-
chess bot उदाहरण: user WhatsApp पर "मेरे bishop से knight को मारो" भेजता है → LLM chessboard की state बनाए रखते हुए खुद खेल भी सकता है, लेकिन reliability, performance, maintenance के लिहाज़ से इसमें कई समस्याएँ हैं
-
performance: LLM की chess खेलने की क्षमता प्रभावशाली है, लेकिन फिर भी यह dedicated chess engine (जैसे: Stockfish) की तुलना में धीमा है और इसकी accuracy भी कम है
-
debugging और tuning मुश्किल: उसने ऐसा निर्णय क्यों लिया, यह समझना कठिन होता है, इसलिए उसे इच्छित तरीके से काम करने के लिए ठीक करना आसान नहीं है
-
अन्य समस्याएँ:
- LLM output का test करना कठिन है
- math या random number generation में इसका प्रदर्शन कमजोर है
- version control और auditing कठिन हैं
- natural language में state बनाए रखने का तरीका नाज़ुक है
- API pricing, rate limit जैसी समस्याएँ आती हैं
- security boundary धुंधली हो जाती है
अलग-अलग उदाहरणों से सही role separation
- game में "मैं player X पर vorpal sword से attack करूँगा" → LLM को बस इसे
attack(player=X, weapon="vorpal_sword")के रूप में बदलकर game logic को सौंपना चाहिए - negotiation agent → LLM को negotiation का निर्णय नहीं लेना चाहिए; उसे केवल user input को पैकेज करके negotiation engine को देना और result पहुँचाना चाहिए
- random response generation → चयन LLM को नहीं करना चाहिए; इसे external random function से संभालना चाहिए
LLM किस काम में अच्छा है
- LLM transformation, interpretation, communication में विशेष रूप से अच्छा है
- उदाहरण:
- "orc को तलवार से मारता हूँ" →
attack(target="orc", weapon="sword")में बदलना { "error": "insufficient_funds" }→ "आपके पास पर्याप्त gold नहीं है" के रूप में स्वाभाविक ढंग से समझाना- यह classify कर सकता है कि user input combat command है, inventory check है, या help request
- यह human concepts (उदा.: blade = sword, smash = attack) को अच्छी तरह समझता है
- "orc को तलवार से मारता हूँ" →
- मुख्य बात यह है कि यह complex judgment या state management के लिए नहीं है → यह केवल user intent को system से जोड़ने वाला एक bridge है
भविष्य की दिशा और बने रहने वाले सिद्धांत
- तकनीक तेज़ी से आगे बढ़ रही है, इसलिए जो आज संभव नहीं है वह जल्द संभव हो सकता है
- लेकिन वे structural समस्याएँ जिन्हें LLM हल नहीं कर सकता, संभव है कि आगे भी बनी रहें:
- ऐसा logic जो LLM पर निर्भर नहीं है, उसे समझना आसान होता है, और maintenance व version control भी आसान होते हैं
- execution cost भी कम होती है
- भविष्य में भी यही लागू होगा: LLM को interface की भूमिका पर केंद्रित रखना चाहिए, और core logic dedicated systems को सौंपना चाहिए
1 टिप्पणियां
Hacker News राय
लॉजिक के दो प्रकार होते हैं
पहला प्रकार security, finance, mathematics जैसे क्षेत्रों में आता है
दूसरे प्रकार को AI द्वारा बदले जाने की संभावना अधिक है
एक ही application के अलग-अलग हिस्से पहले या दूसरे प्रकार के लिए उपयुक्त हो सकते हैं
हाल की एक hackathon में एक educational game बनाया गया
LLM को लॉजिक implement नहीं करना चाहिए
LLM की क्षमताओं को समझना कठिन है
अगर LLM response तेज़ और सस्ता चाहिए, तो छोटे prompts और छोटे models का उपयोग करना चाहिए
केवल LLM के भरोसे testing करना कठिन है
business logic में LLM का उपयोग जोखिमभरा है
AI से बनाई गई images का उपयोग करके लेखों का सारांश बनाया जा सकता है