- ChatGPT Atlas एक नया AI-आधारित वेब ब्राउज़र है जो ChatGPT को केंद्र में रखते हुए उपयोगकर्ता के संदर्भ, टूल और कार्यों को एकीकृत करके इसे ‘सुपर असिस्टेंट’ में बदलने का लक्ष्य रखता है
- Atlas में उपयोगकर्ता जहाँ भी वेब पर ब्राउज़ करे, ChatGPT उसके साथ रहता है और पेज छोड़े बिना काम करने तथा संदर्भ समझने में मदद करने की क्षमता देता है
- ब्राउज़र मेमोरी के ज़रिए यह उपयोगकर्ता द्वारा देखी गई साइटों के संदर्भ को याद रखकर प्रश्नों के उत्तर, सारांश और शेड्यूलिंग जैसी कार्रवाइयों में मदद करता है
- एजेंट मोड (Agent Mode) के माध्यम से ChatGPT उपयोगकर्ता के ब्राउज़िंग वातावरण में टैब खोलना, जानकारी खोज निकालना, बुकिंग करना, ऑर्डर करना जैसी वास्तविक कार्रवाइयाँ कर सकता है
- macOS के लिए वैश्विक रूप से लॉन्च किया गया है, और आगे Windows, iOS, Android संस्करण आने वाले हैं; इसलिए इसे AI-आधारित ब्राउज़िंग के नए चरण के रूप में देखा जा रहा है
- ChatGPT Atlas ChatGPT और वेब ब्राउज़र को जोड़कर बना एक AI-आधारित वेब ब्राउज़र टूल है
- यह केवल बेसिक सर्च से आगे बढ़कर उपयोगकर्ता का संदर्भ समझने और कार्रवाई करने वाला इंटेलिजेंट ब्राउज़र वातावरण बनाने का लक्ष्य रखता है
- OpenAI की मौजूदा ChatGPT वेब सर्च फ़ीचर की तेज़ी से लोकप्रियता बढ़ने के बाद, कंपनी ने ब्राउज़र को AI-केंद्रित तरीके से दोबारा डिज़ाइन किया ताकि वर्क ऑटोमेशन, रिसर्च, शेड्यूलिंग तक सपोर्ट करने के लिए बनाया जा सके
- उपयोगकर्ता को अलग से कॉपी-पेस्ट करने की जरूरत नहीं; वे सीधे Atlas विंडो के अंदर ChatGPT की मदद ले सकते हैं
ब्राउज़र मेमोरी फीचर
- Atlas, उपयोगकर्ता द्वारा देखी गई साइट जानकारी के आधार पर ब्राउज़र मेमोरी सहेजता है और संदर्भ-आधारित बातचीत तथा पर्सनलाइज़्ड सहायता प्रदान करता है
- उदाहरण: “पिछले हफ्ते देखी गई नौकरी पोस्ट का सारांश बना दो” जैसी रिक्वेस्ट इसे स्वचालित रूप से संभालने में मदद मिलती है
- मेमोरी पूर्णतया उपयोगकर्ता नियंत्रण में प्रबंधित की जाती है; उपयोगकर्ता चाहे तो कभी भी देख, सहेज या हटा सकता है
- ब्राउज़र हिस्ट्री हटाने पर संबंधित मेमोरी भी हट जाती है, और स्मृति की सीमा को साइट स्तर पर सेट किया जा सकता है
- डिफ़ॉल्ट रूप से ब्राउज़िंग कंटेंट मॉडल ट्रेनिंग में इस्तेमाल नहीं होता; केवल तभी ट्रेनिंग डेटा में शामिल होता है जब उपयोगकर्ता स्पष्ट रूप से ऑप्ट-इन करे
एजेंट मोड (Agent Mode)
- Atlas में बिल्ट-इन Agent Mode वह फीचर है जिसमें ChatGPT उपयोगकर्ता के ब्राउज़र के अंदर वास्तविक काम कर सकता है
- उदाहरण के लिए, किसी रेसिपी के आधार पर सामान को कार्ट में डालना और ऑर्डर करना, या दस्तावेज़ पढ़कर प्रतिस्पर्धी विश्लेषण करना
- एजेंट उपयोगकर्ता की अनुमति लेकर टैब खोलता, क्लिक करता और काम आगे बढ़ाता है
- Plus, Pro और Business उपयोगकर्ताओं के लिए यह प्रिव्यू वर्ज़न के रूप में उपलब्ध है, और तेज़ी व बेहतर विश्वसनीयता के लिए इसे लगातार बेहतर किया जा रहा है
सुरक्षा और गोपनीयता
- Atlas में सुरक्षा-प्रथम डिज़ाइन अपनाई गई है और इसमें निम्न सीमाएँ लागू हैं
- ब्राउज़र के अंदर कोड रन नहीं किया जा सकता, फाइल डाउनलोड नहीं हो सकती, और एक्सटेंशन इंस्टॉल नहीं किए जा सकते
- लोकल फाइलों या अन्य ऐप्स तक पहुँच नहीं
- फाइनेंशियल संस्थानों जैसी संवेदनशील साइटों पर इसे स्वतः पॉज़ कर दिया जाता है
- लॉगआउट मोड में भी एजेंट उपयोग करने से पर्सनल जानकारी के एक्सपोज़र रिस्क को कम किया जा सकता है
- मैलिशियस पेज या ईमेल में छुपे कमांड अटैक्स को रोकने के लिए हज़ारों घंटे का रेड टीम टेस्ट किया गया, और नई अटैक कैटेगरी का जवाब देने के लिए तत्काल पैचिंग सिस्टम चलाया जाता है
- उपयोगकर्ताओं को सुझाव है कि Atlas इस्तेमाल करते समय डेटा एक्सपोज़र के रिस्क को ध्यान में रखते हुए टास्क मॉनिटरिंग और लॉगआउट मोड का इस्तेमाल करें
डेटा और नियंत्रण सेटिंग
- उपयोगकर्ता पता बार के टॉगल से यह नियंत्रित कर सकता है कि ChatGPT को किन साइटों की साइट विज़िबिलिटी दिखे
- डिसेबल करने पर पेज कंटेंट एक्सेस ब्लॉक हो जाता है और मेमोरी निर्माण रुक जाता है
- अगर ट्रेनिंग डेटा में शामिल करना हो, तो सेटिंग के “include web browsing” विकल्प से वेब कंटेंट को ट्रेनिंग में जोड़ा जा सकता है
- पैरेंटल कंट्रोल भी मजबूत किया गया है, जिससे माता-पिता ब्राउज़र मेमोरी या एजेंट मोड को डिसेबल कर सकते हैं
सपोर्ट प्लेटफॉर्म और रिलीज़
- ChatGPT Atlas macOS के लिए तुरंत जारी किया गया है, और Free, Plus, Pro, Go सभी उपयोगकर्ताओं के लिए उपलब्ध है
- Business, Enterprise, Edu प्लान के उपयोगकर्ता भी, यदि एडमिन सक्रिय करें, तो इसका उपयोग कर सकते हैं
- Windows, iOS, Android संस्करण जल्द आने वाले हैं
- उपयोगकर्ता अपने वर्तमान ब्राउज़र से बुकमार्क, पासवर्ड और हिस्ट्री इम्पोर्ट करके आसानी से शिफ्ट कर सकते हैं
भविष्य की योजनाएँ
- OpenAI ने Atlas के अगले चरण के लिए मल्टी-प्रोफाइल सपोर्ट, डेवलपर टूल्स में सुधार, और Apps SDK इंटीग्रेशन एक्स्टेंसिबिलिटी को शेड्यूल किया है
- वेबसाइट ऑपरेटर ARIA टैग जोड़कर ChatGPT एजेंट को अपनी साइट पर अधिक सटीकता से काम करने में मदद कर सकते हैं
- यह लॉन्च AI के ब्राउज़र के अंदर आकर ‘इंटरएक्टिव वेब अनुभव’ को वास्तविक बनाने की पहली सीढ़ी के रूप में आंका गया है
1 टिप्पणियां
Hacker News टिप्पणी
मेरा मानना है कि केवल गोपनीयता पर ही फोकस करना दृष्टि को सीमित कर देता है; असली सवाल यह है कि क्या यह तकनीक पारंपरिक इंटरनेट ब्राउज़िंग को बुनियादी रूप से बदलने की क्षमता रखती है और वेब ट्रैफिक की मोनेटाइज़ेशन पर इसका क्या असर होगा। खासकर यह फर्क बड़ा है कि यह सच में नए अनुभव का V0.1 है या V1.0—अगर यह V1.0 स्तर पर है, तो पारंपरिक वेब से बदलाव तेज़ी से आगे बढ़ सकता है और आर्थिक असर भी काफ़ी बड़ा हो सकता है; यानी डेटा सेंटर एआई निवेश को भी आसानी से उचित ठहराया जा सकता है।
ChatGPT Atlas के DMG इंस्टॉलर के मुख्य स्क्रीन मैं नोट करके लिख रहा हूँ (इंस्टॉलेशन स्क्रीनशॉट):
मुझे लगता है OpenAI का जवाब Perplexity के Comet जैसा है, चिंता यही है कि कहीं यह ही भविष्य न बन जाए। सच यह है कि ऐसे AI ब्राउज़र कुछ मूल्य दे सकते हैं, लेकिन आखिरकार सब कुछ नियंत्रित करने वाला एक ही Big Tech उभरने जैसा लगता है। इसलिए उम्मीद है कि open source ब्राउज़र (जैसे Firefox) जल्दी अपने LLM के साथ विकल्प दें। क्लाउड आधारित LLM की जगह on-device प्रोसेसिंग बेहतर होगी, लेकिन समस्या यह है कि लगभग सभी अच्छे ML इंजीनियर पहले ही बिग टेक में जा चुके हैं।
मैंने Atlas के agent मोड को टेस्ट किया। अपने अनुभव और रुचियों के आधार पर उसने HN टिप्पणियों में से वे पोस्ट खोजकर दिए जिन पर मैं अतिरिक्त insight जोड़ सकता था; नतीजे में 7 टिप्पणियाँ थीं जो मैं अच्छी तरह समझता हूँ (startup/cloud), और 3 जो कम समझ में आती हैं (Fine-tuning LLM)। सुझाए गए टिप्पणियों की सामग्री वही थी जो मैं कह सकता था, लेकिन मेरे बोलने के अंदाज़ से दूरी महसूस हुई। टेस्ट के बाद लगा कि अगर मैं इसे इस्तेमाल करूँ तो जो चीजें मैं खुद मज़े से करता हूँ वे निर्जीव काम बन जाएँगी। टूल रोचक है, पर इसका उपयोग कहाँ करना है अभी स्पष्ट नहीं।
क्यों Atlas ब्राउज़र केवल macOS पर सपोर्ट हो रहा है, यह समझ नहीं आता; Linux या Windows का सपोर्ट होता तो ज्यादा ऑफ़िशियल लॉन्च जैसा लगता।
इसमें इस्तेमाल की जगह साफ दिखती है, लेकिन मुझे लगता है कि मैं रोज़मर्रा की ज़िंदगी पूरी की पूरी AI कंपनी को दे रहा हूँ। यदि प्रश्न हो तो सीधे ChatGPT ऐप खोलकर पूछना बेहतर लगता है। मेरे हिसाब से यह Honey ब्राउज़र एक्सटेंशन जैसी श्रेणी है, लेकिन डेटा लॉस के लिहाज से समस्या कहीं ज्यादा गंभीर है क्योंकि डेटा सच में निजी रहेगा, यह मैं एक सेकंड भी नहीं मान सकता।
Atlas निश्चित रूप से Chromium-based है, लेकिन कहीं भी Chromium का उल्लेख, लाइसेंस या क्रेडिट नहीं दिखता; यहाँ तक कि chrome:// पेज भी बंद हैं। अगर यह ओपन सोर्स आधारित प्रोजेक्ट है, तो स्रोत और आधार का उल्लेख कम से कम पारदर्शिता की बुनियादी अपेक्षा है। शुरुआत में कमी हो सकती है, लेकिन ऐसा तो होना ही चाहिए। क्या यह कोई मानक तरीका है या केवल मुझे ही अटपटा लग रहा है?
OpenAI शायद वही हिस्से उठा रहा है जो Apple Intelligence नहीं कर पा रहा है। बेहतर होता अगर ये फीचर सीधे macOS में ही एंबेड हो जाते—FoundationLLM से local compute/privacy को अधिकतम करें और जब सच में जरूरी हो तभी अपने सर्वर पर बड़े फ्रंटियर मॉडल कॉल करें। मेरा मानना है कि macOS को AI असिस्टेंट क्वालिटी के लिए OS लेवल पर कहीं गहराई से एकीकृत बदलाव करना ही होगा। Apple Intelligence शुरुआत में ठीक थी, लेकिन local मॉडल पावर पर्याप्त नहीं है, इसलिए key features कहीं स्टैक के अंदर छिपे लगते हैं।
मैं LLM Chrome प्लगइन इसलिए नहीं उपयोग करता क्योंकि भरोसा नहीं कि ब्राउज़र डेटा अत्यधिक एकत्र न हो जाए। इसमें भी वही चिंता है; फर्क सिर्फ यह कि इस बार कंपनी की image भरोसे वाली लगती है। सच में बेहतर है या नहीं, मैं अभी नहीं कह सकता।
अगर यह टेक्नोलॉजी सच में उपयोगी लगे, तो यह भी देखना होगा कि किसी सर्वसत्तावादी शासन को यह कितना आकर्षक लगेगा। अगर विज्ञापन देखकर कभी सिहरन हुई हो, तो Atlas एक root-level keylogger सेवा जैसा लगता है—मैं क्यों किसी AI कंपनी को अपनी सभी ब्राउज़र अंतःक्रियाएँ collect/record करने दूँ? Google पहले से Chrome के जरिए बहुत कुछ करता है, लेकिन ad optimization और मानव संज्ञान प्रक्रिया को रिकॉर्ड करके सामान्य AI मॉडल ट्रेनिंग डेटा खोजने का उद्देश्य पूरी तरह अलग है।