1 पॉइंट द्वारा GN⁺ 2024-06-11 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Apple ने iOS, iPadOS और macOS में ChatGPT को integrate किया है, ताकि users apps के बीच स्विच किए बिना image और document understanding जैसी सुविधाओं का उपयोग कर सकें
  • जरूरत पड़ने पर Siri, ChatGPT का उपयोग करेगी, और सवाल, documents या photos भेजे जाने से पहले user confirmation लेगी
  • पूरे system में उपलब्ध Writing Tools में भी ChatGPT शामिल होगा, जो writing assistance और विभिन्न styles में image generation प्रदान करेगा
  • Siri और Writing Tools में OpenAI requests को store नहीं करता और IP addresses को छिपाता है; account connect करने पर ChatGPT account की data settings लागू होंगी
  • GPT‑4o आधारित integration इस साल के अंत में iOS, iPadOS और macOS पर उपलब्ध होगा, और free non-login use के साथ subscribers के paid features तक access—दोनों को support करेगा

Apple experience के भीतर ChatGPT

  • Apple ने iOS, iPadOS और macOS के user experience में ChatGPT को integrate किया है
    • Users अलग tool पर जाए बिना ChatGPT features का उपयोग कर सकते हैं
    • Integrated features में image और document understanding शामिल है
  • जब मददगार हो, Siri ChatGPT का उपयोग करेगी
    • सवाल, documents या photos ChatGPT को भेजे जाने से पहले Apple user से confirmation लिया जाएगा
    • Siri, ChatGPT के जवाबों को सीधे display करेगी
  • पूरे system में उपलब्ध Writing Tools में भी ChatGPT इस्तेमाल किया जा सकता है
    • जिस topic पर लिखा जा रहा है, उसके अनुसार content generation में मदद ली जा सकती है
    • ChatGPT image tools से लिखे हुए content को बेहतर बनाने के लिए विभिन्न styles में images generate की जा सकती हैं

उपलब्धता और privacy protection

  • Siri और Writing Tools से ChatGPT access करते समय privacy safeguards लागू होंगे
    • OpenAI requests को store नहीं करेगा
    • User IP addresses छिपाए जाएंगे
  • Users अपना ChatGPT account connect कर सकते हैं
    • Account connect करने पर user की data settings ChatGPT policy के अनुसार लागू होंगी
  • Integration GPT‑4o पर आधारित है और इस साल के अंत में iOS, iPadOS और macOS पर उपलब्ध कराया जाना निर्धारित है
    • Account बनाए बिना free access मिल सकेगा
    • ChatGPT subscribers अपना account connect करके इसी experience में paid features का उपयोग कर सकेंगे
  • यह partnership advanced AI को सभी के लिए accessible बनाने के OpenAI के mission से जुड़ी है

1 टिप्पणियां

 
GN⁺ 2024-06-11
Hacker News की राय
  • यह शुरुआती iOS के Facebook/Twitter इंटीग्रेशन जैसा महसूस होता है। यह फीचर बस कुछ ही साल चला था
    Apple को फिलहाल लगता है कि उसे एक dedicated large language model सेवा चाहिए, लेकिन मुख्य फीचर्स का बड़ा हिस्सा वह खुद प्रोसेस कर रहा है और OpenAI के इस्तेमाल के लिए स्पष्ट सहमति मांगता है। यह देखते हुए कि वह दूसरे models भी जोड़ने की बात कर रहा है, लगता है कि Apple OpenAI को कुछ हद तक commodity की तरह देख रहा है, और यह 10 साल का contract जैसा नहीं लगता

    • सहमत। अभी फायदा है इसलिए इस्तेमाल करेगा, लेकिन करीब 3 साल बाद शायद OpenAI की publicly आलोचना करेगा कि वह data privacy की पर्याप्त रक्षा नहीं करता, और ऐसे दिखाएगा जैसे पहले कभी कोई संबंध था ही नहीं
    • 3–5 साल के भीतर ढेरों AI box और input field के बगल में AI बुलाने वाले चमकदार icons चुपचाप गायब हो जाएंगे, ऐसा लगता है
      large language models सटीक नहीं हैं, और वे ऐसे domain expert भी नहीं हैं जो 5% error margin के भीतर सही बैठते हों। लोग धीरे-धीरे यह समझेंगे, और models को up-to-date रखने व चलाने की लागत भी शायद तेजी से कम नहीं होगी, इसलिए आखिरकार bubble बैठ जाएगा
    • intuitively यह Apple के मनचाहे user experience को लागू करने के लिए अस्थायी उपाय जैसा दिखता है
      Apple का अंतिम लक्ष्य शायद ज्यादा से ज्यादा AI फीचर्स को on-device ले जाना होगा
    • Sam Altman और OpenAI दोनों में मुझे कई बातें पसंद नहीं हैं, लेकिन OpenAI ने Google और Apple को पूरी तरह पीछे छोड़ दिया है, और trillion-dollar कंपनियों को एक startup की बराबरी करने की कोशिश करते देखना वाकई हैरान करने वाला है
      ऐसी चीजें और ज्यादा हों तो अच्छा होगा। Big Tech ने बहुत लंबे समय तक innovation को रोका है
    • असहमत। यह लंबे समय से चले आ रहे Safari के Google partnership जैसा ज्यादा लगता है
      बस इस बार बड़ा cheque पाने वाली तरफ शायद OpenAI होगा
  • GPT-4o access एक सुविधाजनक feature है, लेकिन मैं सच में यह सुनना चाहता था कि Siri की language understanding बेहतर हुई है या नहीं
    इस WWDC presentation में कुछ examples आए कि Siri context बनाए रखकर “उसकी flight arrival time calendar में add कर दो” जैसे request में “उसकी” किसे कहा गया है, यह समझती है। लेकिन रोजमर्रा में Siri के पास large language model स्तर की language understanding नहीं है, और अभी भी वह fixed phrases के हिसाब से बना कोई चतुर Eliza-style hack लगती है। “जिस गाने को skip करने को मैंने कहा था, उसके ठीक पहले जो song चल रहा था उसे play करो” जैसी request GPT-4o आसानी से handle कर लेता है, लेकिन Siri समझ नहीं पाती दिखी। जानना चाहता हूं कि Siri का underlying language model कितना upgrade होगा

    • आज voice assistants में सबसे बड़ी irritant यही है। अच्छी बात है कि complex या ambiguous requests को interpret करने की तकनीक ChatGPT के रूप में पहले से आ चुकी है
      लगता है Apple ने भी weather पूछते समय presenter के sentence के बीच में अपनी बात बदलने का demo दिखाया था, और उम्मीद है कि यह इस बात का संकेत था कि user request की intent समझने के लिए large language model लगाया गया है
    • मौजूदा voice assistants कुल मिलाकर सब खराब हैं। Siri जो भी हो, Google Assistant उससे भी बदतर है
      इसके उलट पिछले कुछ महीनों में ChatGPT app ने noisy environment में भी natural बोलने पर speech को text में 5% से कम error के साथ बदला, और transcription errors होने पर भी असली intent को ठीक से समझा। बेहतर voice assistant बनाने के लिए GPT-4 को phone पर किए जा सकने वाले functions की specification देकर operating system से integrate करना काफी होगा, फिर भी कोई कंपनी इसे ठीक से क्यों नहीं कर पाई, यह समझ नहीं आता। OpenAI ने भी ChatGPT app को उस direction में extend क्यों नहीं किया, यह अजीब है
    • लगता है Cortana भी ऐसा context handling करती थी। 2024 में यह level काफी फीका है
    • Apple keynote में ऐसा लगा कि पुराने Siri model पर जबरन context feature चिपकाने की बजाय, Siri को Apple Intelligence based बड़े update के रूप में पेश किया जा रहा है
      उन्होंने नए voice transcription feature, बोलते-बोलते खुद को correct करने की क्षमता, personal context की गहरी समझ आदि की बात की। यह generative AI model को photo classification जैसी चीजों तक ज्यादा व्यापक रूप से लागू करने वाला बड़ा update लगता है, लेकिन असल में देखना होगा
    • Apple काफी समय से दावा करता आया है कि वह ऐसी चीजें कर सकता है। अभी इस पर खास भरोसा करने का मन नहीं होता
  • यह लगभग वही है जो मैं चाहता था। कार में Siri से पूछने की इच्छा होती थी, लेकिन वह handle नहीं कर पाती थी, ऐसे कई सवाल थे
    उदाहरण के लिए: “मैं अभी किस state में हूं, अगली state border तक कितना बचा है, और जिन states से गुजरूंगा वहां खुद fuel भर सकता हूं क्या?” हालांकि यह कुछ हद तक इस पर निर्भर है कि Google Maps से जानकारी निकाली जा सकती है या नहीं

    • इसका ज्यादातर हिस्सा ChatGPT नहीं बल्कि Apple Intelligence के जरिए जाएगा लगता है
      Apple Intelligence ने कहा था कि वह current location, schedule जैसी जानकारी को ध्यान में रखकर ज्यादा local और personalized तरीके से काम करेगा। Apps के पास “intent” provide करने वाला API है, और Siri उन्हें जोड़कर “सबसे पास के fuel station पर petrol/diesel का price” जैसी requests handle कर सकती है। keynote के हिसाब से यह हिस्सा OpenAI नहीं है
    • अभी CarPlay की Siri functionality काफी limited है। CarPlay में अक्सर वह ऐसे complex सवालों का भी जवाब नहीं देती जिनका जवाब CarPlay के बाहर दे सकती है
    • सोच रहा हूं कि “मैं अभी किस state में हूं, अगली state border तक कितना बचा है, और जिन states से गुजरूंगा वहां खुद fuel भर सकता हूं क्या?” जैसी जरूरत किस तरह की यात्रा में पड़ती है
      ज्यादातर इसे “मेरी current location क्या है?”, “map दिखाओ”, “किन states में self-service fuel ban है?” की तरह दोबारा कहा जा सकता था
    • मुझे लगा था कि सिर्फ Oregon ही ऐसा state है जहां कानूनन attendant fuel भरता है
    • बेशक यह सिर्फ Apple Maps इस्तेमाल करने पर ही काम करेगा
  • OpenAI को सभी users के लिए मुफ्त उपलब्ध system-wide third-party dependency के रूप में integrate करना scale और technology के लिहाज से OpenAI की maturity पर काफी भरोसे का दिलचस्प संकेत है

    • “दिलचस्प” बिल्कुल सही शब्द है। OpenAI की reliability आमतौर पर 2-person startup से भी खराब है, लेकिन machine learning quality उतनी ही अच्छी है
  • OpenAI एक विवादों में रहने वाली कंपनी है, और ब्रांड alignment के लिहाज़ से Anthropic जैसे अच्छे competitors भी हैं जो बेहतर लगते हैं। इसलिए यह deal अजीब लगती है

    • OpenAI/ChatGPT AI में इकलौता ऐसा नाम है जिसे आम लोग बड़े पैमाने पर जानते हैं
      Anthropic अगर 10 गुना बेहतर भी हो, तो customers और public-market investors के लिए वह “ChatGPT” नाम जितना अहम न हो सकता है। Google ने search में जीत सिर्फ इसलिए नहीं हासिल की कि वह थोड़े समय के लिए सबसे अच्छा search engine था, बल्कि इसलिए भी कि लगातार media coverage से उसका brand रोज़मर्रा की क्रिया जैसा जम गया। “ChatGPT से पूछो” के AI के “Google कर लो” बन जाने की संभावना बड़ी है, और OpenAI के आसपास की media controversies भी बस उसकी उस position को और मज़बूत करेंगी
    • Anthropic models इस तरह के कामों के लिए बेहतर हैं, इसलिए यह और भी अजीब है। Claude के जवाब लगभग हमेशा GPT-4 से बेहतर लगते हैं
      GPT-4 अनचाही बातों को बहुत लंबा खींच देता है, इसलिए मैंने उसे इस्तेमाल करना छोड़ दिया। Claude 3 ऐसे जवाब देता है जो इंसान द्वारा दी जाने वाली जानकारी जैसे लगते हैं, और उसमें बेकार की बातें कम होती हैं, इसलिए वह ज़्यादा मानवीय लगता है। इस साल के आखिर में launch के समय कौन-सा model सबसे अच्छा होगा, यह भी पता नहीं है, और हमने यह भी देखा है कि open-source models कितनी तेज़ी से GPT-4 के करीब पहुँचे हैं, तो समझ नहीं आता कि सिर्फ एक कंपनी के model पर ही दांव क्यों लगाया जा रहा है
    • OpenAI के पास खास तौर पर बहुत high-value assets दिखते नहीं हैं। अभी वह inflow पकड़ने के लिए पूरी दुकान सौंप रहा है, और लगता है यह unsustainable game जल्द ही बुरी तरह खत्म होगा
  • यह देखकर हैरानी हुई कि Apple OpenAI पर इतना कम निर्भर है। ज़्यादातर impressive integrations जो सच में उपयोगी लगते हैं, वे on-device या Apple के private cloud पर चलते हैं
    OpenAI का ChatGPT ऐसा लगता है जैसे Siri के एक कोने में धकेल दिया गया हो, जहाँ वह user की अनुमति मिलने पर “Google-style questions” का जवाब देता है। Architecture में बड़ा हिस्सा न मिलना OpenAI के लिए नुकसान जैसा दिखता है, और व्यक्तिगत रूप से मुझे यह राहत की बात लगती है

    • सहमत। पहले की अफवाहें ऐसी लग रही थीं जैसे Apple और OpenAI लगभग merge ही होने वाले हों
      असल में यह iPhone पर latest models तक access है कहने के लिए सिर्फ दिखावे की completeness जैसा लगा। निजी तौर पर ecosystem के साथ गहरा integration, और meaning-based indexing मुझे कहीं ज़्यादा दिलचस्प लगते हैं
  • मुझे अब भी एक भी ऐसा व्यक्ति नहीं पता जो यह सब चाहता हो। मुझे web browser में, email client में, या phone में AI नहीं चाहिए
    आसपास पूछने पर भी सब लगभग इसी तरह सहमत लगते हैं, तो समझ नहीं आता यह आखिर किसके लिए है

    • बच्चे को सुनाने वाली nursery rhyme को दूसरी भाषा में translate करते हुए rhyme और meaning मोटे तौर पर बनाए रखने में यह मददगार रहा
      GPT-3 में यह खास नहीं था, लेकिन 4o, या latest model, यह काम वाकई अच्छी तरह करता है। मूल रूप से यह “किसी चीज़ की style को किसी दूसरी चीज़ पर ले जाने” वाले कामों में मजबूत है। लेकिन Google पर न मिले किसी fact के बारे में पूछो तो यह हमेशा हास्यास्पद रूप से गलत निकला
    • simple requests को भरोसेमंद तरीके से handle करने वाला virtual assistant मैं सच में चाहता हूँ
      बस अब तक कंपनियाँ अभी दिशा खोजने के phase में लगती हैं, जैसे दीवार पर सब कुछ फेंककर देख रही हों कि क्या चिपकता है। उम्मीद है 2–3 साल बाद चीज़ें settle होंगी और हमें एक शानदार virtual assistant मिल सकेगा
    • पूरी तरह सहमत। अब तक जो कुछ generate हुआ है, वह सब बेहद average था
      कुछ legitimate use cases हो सकते हैं, लेकिन हमेशा की तरह लगता है कि सब लोग पर्याप्त सोच-विचार किए बिना ज़रूरत से ज़्यादा दौड़ रहे हैं
    • मैं चाहता हूँ। दिन भर मैं अपने लिखे text को large language model में डालकर editing help लेता रहता हूँ
      brainstorming या research शुरू करते समय भी ChatGPT को voice mode में खोलकर बोलता हूँ, और साथ-साथ browser खोलकर output का fact-check करता हूँ
    • अब तो आप कुछ लोगों को जान ही गए। अच्छा होगा अगर phone से पूछ सकूँ, “पिछले हफ्ते interview के बारे में email भेजने वाले का नाम क्या था?”
      क्योंकि तब दिमाग में चल रहा context खोने से बचाने के लिए email खंगालना नहीं पड़ेगा
  • यह अच्छा दिखता है, लेकिन असल में OpenAI के लिए existential threat हो सकता है
    जब कोई एक बहुत बड़ा customer होता है, तो वह customer business पर बहुत ज़्यादा power रखने लगता है। Apple किसी दिन बस पैसे न देने का फैसला कर सकता है, और lawsuits में सालों लगें तब भी टिके रहने की क्षमता रखता है। Benjamin Moore, Home Depot या Lowe’s को बेचने के बजाय अपनी stores बनाए रखता है, इसकी वजह भी यही है कि बड़े customers शर्तें थोप सकते हैं। Apple ने machine-learning processing तेज़ करने के लिए अपने chips तक design किए हैं, और OpenAI partnership साफ तौर पर temporary fix है। मौका मिलने पर वह OpenAI को कमजोर करेगा, और संभव होते ही replace करेगा। Apple core functions के लिए partners पर निर्भर रहना पसंद नहीं करता, इसलिए उसने Google Maps छोड़कर अभी भी कमजोर Apple Maps अपनाया, और Google Search को replace नहीं कर पा रहा है क्योंकि Google भारी रकम देता है और Apple अभी replacement में सफल नहीं हुआ है। OpenAI के लिए यह अच्छा card लग सकता है, लेकिन यह लोमड़ी को मुर्गीखाने में घुसाने जैसा है

    • अभी आपने जो कहा, उसमें से किसी एक बात के लिए भी citation है?
      Apple का cost न चुकाकर lawsuit में टिके रहना OpenAI और Microsoft भी ठीक वैसे ही कर सकते हैं, और अगर इससे Apple को नुकसान पहुँचे तो Microsoft खुश ही होगा। Apple ने जिन suppliers का इस्तेमाल किया है, उनके साथ इस तरह व्यवहार करने का कोई precedent भी नहीं है। Benjamin Moore वाली बात भी इसलिए है कि Home Depot का अपना brand Behr है, और Behr के हर color के लिए बताया जाता है कि उसने कौन-सा Benjamin Moore color copy किया है, जिससे वह substitute बनकर sales ले जाता है। Apple Maps “अभी भी कमजोर” है, इसे आप कैसे define करते हैं, आप दिन में Apple Maps कितनी बार इस्तेमाल करते हैं, और क्या दोनों services की तुलना करने वाला कोई benchmark है—यह जानना चाहूँगा
    • OpenAI के पास पहले से ही “एक बहुत बड़ा customer” था। वह Microsoft है
      बल्कि Apple deal पहला संकेत है कि OpenAI असल में Microsoft की subsidiary नहीं है
    • Apple अपने मौजूदा computing platforms में AI को जितनी जल्दी हो सके integrate करने की दौड़ में है
      OpenAI शायद मानता होगा कि sufficiently smart AI, यानी AGI या ASI, कहीं बड़े problems हल करेगा या व्यावहारिक रूप से पूरी तरह नया computing platform बना देगा। सच तो यह है कि अभी का अधूरा large language model ChatGPT भी लगभग अपने-आप में computing platform जैसा दिखता है। Apple लोगों को apps और शानदार devices के बिना agents से interact करने के तरीके का आदी बनने की गति बढ़ा रहा है। अगर AI सच में पर्याप्त अच्छा हो गया, तो 10–15 साल बाद किसे Apple की जरूरत होगी, पता नहीं
  • “Siri और Writing Tools में ChatGPT तक पहुँचते समय privacy protection built-in है, requests OpenAI में store नहीं की जातीं, और user IP address छिपा दिया जाता है। users अपना ChatGPT account भी connect कर सकते हैं, और इस स्थिति में data settings ChatGPT policy के अनुसार चलती हैं” ऐसा वाक्य है
    तो क्या इसका मतलब है कि आम Apple user की ChatGPT requests default रूप से OpenAI training में इस्तेमाल नहीं होतीं, लेकिन paid ChatGPT Plus customers की हो सकती हैं? यह भी जानना चाहता हूँ कि ChatGPT Plus account connect करने का मतलब क्या यह है कि मेरा data training में इस्तेमाल होगा। Partnership से आए users की तुलना में paid customers के लिए privacy standard कम होना अजीब लगता है। बेशक, मुझे पता है कि “Temporary Chat” feature या memory off करके training use को रोका जा सकता है

    • Account settings में OpenAI को chat data training में इस्तेमाल करने से permanently off किया जा सकता है
      “Model training disable करने के लिए, page के bottom-left में profile icon से Settings > Data Controls पर जाएँ और ‘Improve the model for everyone’ को off कर दें। जब यह setting off होती है, तो नई conversations model training में इस्तेमाल नहीं होतीं”