- फ़्लाइट बुकिंग AI एजेंट डेमो का "Hello World" क्यों बन गई?
- उपयोगकर्ता AI द्वारा फ़्लाइट बुक कराने से ज़्यादा पहले से मौजूद परिपक्व UX (जैसे: Google Flights) को पसंद करते हैं
- सिर्फ़ एक बार की गलती से जटिल customer service का दुःस्वप्न शुरू हो सकता है
- सहज और पूर्वानुमेय सिस्टम वास्तव में अधिक नवोन्मेषी होते हैं
- AI अभी भी शुरुआती चरण में है, और सामान्य उपयोगकर्ता consistency और predictability की अपेक्षा करते हैं
- उदाहरण: 80% accuracy हो, लेकिन परिणाम लगातार एक जैसे हों तो वह स्वीकार्य हो सकता है
वहीं, अनियमित 90% accuracy भरोसा तोड़ देती है
- कई AI प्रोजेक्ट इसे नज़रअंदाज़ कर चमकदार डेमो और ज़रूरत से ज़्यादा फीचर्स का पीछा करते हैं → अंततः भरोसा खो देते हैं
- ज़्यादा से ज़्यादा IDE पारदर्शिता खोते जा रहे हैं
- उपयोगकर्ता यह नहीं समझ पाते कि AI क्या कर रहा है
- उदाहरण: Reddit पर चर्चा में रहा Cursor द्वारा पूरा काम delete कर देने का मामला
- इसमें उपयोगकर्ता की version control की कमी भी समस्या थी, लेकिन असल कारण UI/UX डिज़ाइन था
- अच्छा डिज़ाइन गलतियों को रोकता है, AI की गतिविधि को स्पष्ट रूप से समझाता है, और undo फ़ीचर देता है
- शुरुआती दौर में Cursor:
- tab-complete interface के ज़रिए पारदर्शी और हल्का interaction देता था
- धीरे-धीरे उपयोगकर्ता का भरोसा बनाने के तरीके से लोकप्रिय हुआ
- सरल और reversible डिज़ाइन AI पर अविश्वास कम करने में प्रभावी था
- $200 million निवेश पाने वाला Devin "पूर्ण स्वायत्त एजेंट" की दिशा में गया
- जटिल सिस्टम, धीमी प्रतिक्रिया, और अप्रत्याशित परिणामों ने भरोसा तोड़ दिया
- ज़रूरत से ज़्यादा महत्त्वाकांक्षी approach ने उल्टा उपयोगकर्ताओं में भ्रम पैदा किया
गति बनाम reliability: AI development teams की दुविधा
- AI development teams को निम्न में से एक चुनना पड़ता है:
- तेज़ी से आगे बढ़ना और गलतियों का जोखिम लेना
- reliability और stability को प्राथमिकता देना
- समाधान है उन फीचर्स पर ध्यान देना जो "छोटे दायरे में बेहतरीन प्रदर्शन" कर सकें, और उन्हें लगातार दोहराकर बेहतर बनाना
मुख्य सिद्धांत: complexity से अधिक predictability
- जटिल सिस्टम की बजाय अच्छी तरह समझे गए tasks पर ध्यान देना चाहिए
- AI एजेंट अब भी परिवर्तनकारी हैं, लेकिन निम्न तीन बातें केंद्र में होनी चाहिए:
- reliability
- transparency
- predictability
workflow बनाम agent
- Anthropic की framing: "अगर किसी task को workflow के रूप में व्यक्त किया जा सकता है, तो agent नहीं बल्कि workflow बनाओ"
- workflow पूर्वानुमेय, नियंत्रित करने योग्य, और सरल होते हैं
- agent जटिल और नियंत्रित करने में कठिन होते हैं, इसलिए उनका उपयोग केवल वास्तव में dynamic स्थितियों में करना चाहिए
1 टिप्पणियां
Hacker News राय
"फ्लाइट बुकिंग" एजेंट अब मज़ाक का विषय बन गया है। Swyx के हालिया AI engineer इवेंट keynote में भी इसका ज़िक्र हुआ था
Google Deepmind के शोधकर्ता एजेंट की reliability बढ़ाने के लिए रिसर्च कर रहे हैं
फ्लाइट बुकिंग ऐसा काम है जिसे AI को नहीं सौंपा जा सकता
कई मामलों में लोग AI को मौजूदा workflow में फिट करने की कोशिश करते हैं
Cursor इस्तेमाल के अनुभव से मैं इस निष्कर्ष पर पहुँचा हूँ कि reliability महत्वपूर्ण है
पिछले 20 सालों की तकनीकी प्रगति में मुझे reliability ज़्यादा महत्वपूर्ण लगी है
AI programming की मौजूदा स्थिति पर एक Reddit thread की टिप्पणी मेरी भावनाओं का सार बताती है
मेरा सिद्धांत है कि जब AI code लिखे, तो कम-से-कम मैं उस code को समझ सकूँ
मुझे लगता है कि workflow एजेंट से ज़्यादा महत्वपूर्ण है
Google Flights पहले से ही बेहतरीन UX देता है