AI ब्राउज़र की दुविधा: ‘Roger Rabbit’ एक सवाल है या सर्च क्वेरी?

AI-आधारित ब्राउज़र इस दुविधा से जूझ रहे हैं कि address bar में टाइप किए गए यूज़र के टेक्स्ट को कैसे समझा जाए।

उदाहरण के लिए, अगर कोई यूज़र "Who Framed Roger Rabbit" (फ़िल्म का शीर्षक) टाइप करता है, तो पारंपरिक ब्राउज़र इसे एक search query मानकर फ़िल्म से जुड़े परिणाम दिखाते हैं, लेकिन कुछ AI ब्राउज़र इसे "Roger Rabbit को किसने फँसाया?" जैसे सवाल के रूप में गलत समझकर चैट की तरह सीधे जवाब दे देते हैं। इससे यूज़र को मनचाहे search results नहीं मिलते और असुविधा होती है।

मुख्य AI ब्राउज़रों के approach की तुलना:

Dia (Atlassian द्वारा अधिग्रहित): लोकल classification model (DistilBERT-आधारित, लगभग 160MB) का उपयोग करके "सवाल जैसे" इनपुट का पता लगाता है। उदाहरण: "Atlassian ने ब्राउज़र कंपनी को कितने में अधिग्रहित किया?" → सीधे "610 million dollar" का जवाब। लेकिन इसमें गलतियाँ भी काफ़ी हैं।
ChatGPT Atlas: सरल नियम लागू करता है – 10 शब्दों से कम हो तो search, उससे ज़्यादा हो तो chat। shortcut (⌘+Return) से chat को force भी किया जा सकता है।
Perplexity Comet & Google Chrome: हर query को search engine में भेजते हैं, जहाँ server-side large model तय करता है कि search results दिखाने हैं या AI answer।

दिलचस्प बात यह है कि "who framed roger rabbit" को सवाल की तरह समझने वाला ब्राउज़र सिर्फ Dia है। बाकी सभी इसे search की तरह process करते हैं।

यह समस्या सिर्फ ब्राउज़र तक सीमित नहीं है, बल्कि हर "omnibox"-style input field के लिए एक साझा चुनौती है—यानी ऐसे interface जिन्हें यूज़र की मंशा को तेज़ और सटीक तरीके से समझना होता है। AI चाहे जितना भी स्मार्ट हो जाए, इनपुट की सही व्याख्या करना आगे भी एक अहम चुनौती बना रहेगा।

AI ब्राउज़र की दुविधा: ‘Roger Rabbit’ एक सवाल है या सर्च क्वेरी?

संबंधित पढ़ाई

1 टिप्पणियां