iPhone, iPad और Mac के लिए Apple Intelligence
(apple.com)- Apple ने Apple Intelligence पेश किया है, जो generative models को व्यक्तिगत संदर्भ के साथ जोड़कर भाषा व इमेज generation और apps के बीच tasks execute करने को iPhone, iPad और Mac के मूल अनुभव का हिस्सा बनाता है
- iOS 18, iPadOS 18, macOS Sequoia में Writing Tools, Mail priority व summary, notification summaries, और Notes·Phone में audio recording·transcription·summary फीचर एकीकृत किए गए हैं
- इमेज क्षमताएँ Image Playground, Genmoji, Photos search·Clean Up·Memories तक विस्तृत हैं, और Apple apps के साथ-साथ API अपनाने वाले third-party apps में भी इस्तेमाल की जा सकती हैं
- Siri को text input, screen awareness, apps के अंदर और बाहर सैकड़ों actions, device usage से जुड़े जवाब, और on-device जानकारी पर आधारित requests तक संभालने के लिए विस्तारित किया गया है
- privacy का केंद्र on-device processing और Private Cloud Compute है, जबकि ChatGPT उपयोगकर्ता की अनुमति के बाद Siri और Writing Tools में GPT-4o आधारित integration के साथ जुड़ता है, और beta इस पतझड़ में U.S. English में उपलब्ध होगा
Apple Intelligence की बुनियादी संरचना
- Apple Intelligence iPhone, iPad और Mac के लिए एक personal intelligence system है, जो generative models की क्षमता और उपयोगकर्ता के व्यक्तिगत संदर्भ को जोड़ता है
- यह iOS 18, iPadOS 18, macOS Sequoia में गहराई से integrated है और Apple silicon का उपयोग करके निम्न काम करता है
- भाषा और इमेज को समझना व generate करना
- apps के बीच tasks execute करना
- व्यक्तिगत संदर्भ के आधार पर रोज़मर्रा के काम सरल और तेज़ करना
- अधिक जटिल requests के लिए Private Cloud Compute on-device processing और Apple silicon server-based models के बीच ज़रूरी compute capacity को समायोजित करता है
भाषा समझ और writing tools
- पूरे system में उपलब्ध Writing Tools iOS 18, iPadOS 18, macOS Sequoia में Mail, Notes, Pages, third-party apps सहित लगभग हर writing surface पर लागू होते हैं
- writing assistance फीचर्स का फोकस लेखन के उद्देश्य और format के अनुसार draft को बेहतर बनाना है
- Rewrite: लिखे गए text के कई versions सुझाता है और audience व task के अनुसार tone समायोजित करता है
- Proofread: grammar, word choice, sentence structure की जाँच करता है और correction suggestions व explanation देता है
- Summarize: चुने गए text को paragraph, key bullets, table, list format में summarize करता है
- Mail में inbox के शीर्ष पर urgent emails दिखाने वाला Priority Messages जोड़ा गया है
- email खोले बिना summary देखी जा सकती है
- लंबे threads में एक tap से संबंधित details देखी जा सकती हैं
- Smart Reply तेज़ replies सुझाता है और email के questions पहचानकर बिना कुछ छोड़े जवाब देने में मदद करता है
- notifications में Priority Notifications और summary features लागू किए गए हैं, जिससे lock screen पर निर्णय लेने योग्य जानकारी कम हो जाती है
- महत्वपूर्ण notifications stack के शीर्ष पर दिखते हैं
- लंबे notifications या जमा हुए notifications की मुख्य बातें lock screen पर दिखती हैं
- नया Focus, Reduce Interruptions, केवल उन्हीं notifications को दिखाता है जिन्हें तुरंत ध्यान की आवश्यकता हो सकती है
- Notes और Phone apps में audio को record·transcribe·summarize किया जा सकता है
- call के दौरान recording शुरू करने पर participants को अपने-आप सूचना मिलती है
- call खत्म होने पर Apple Intelligence मुख्य बिंदुओं का summary देता है
इमेज generation और expression features
- Image Playground ऐसा फीचर है जो उपयोगकर्ता को कुछ ही सेकंड में images बनाने देता है, और Animation, Illustration, Sketch तीन styles देता है
- इसे Messages जैसे apps के भीतर सीधे इस्तेमाल किया जा सकता है और यह एक अलग app के रूप में भी उपलब्ध है
- सभी images on-device generate होती हैं
- theme, outfit, accessory, place जैसी categories के concepts चुने जा सकते हैं
- description डालकर image define की जा सकती है
- personal photo library के लोगों को image में शामिल किया जा सकता है
- Messages में बातचीत से संबंधित personalized recommended concepts दिखाए जाते हैं
- उदाहरण के लिए, hiking plan कर रही group chat में friends, destination और activity से जुड़े concepts सुझाए जाते हैं
- Notes में Apple Pencil tool palette के Image Wand से Image Playground इस्तेमाल किया जा सकता है
- एक rough sketch को image में बदला जा सकता है
- खाली जगह चुनने पर आसपास के संदर्भ का उपयोग करके image generate की जा सकती है
- Image Playground Keynote, Freeform, Pages में भी उपलब्ध है, और नया Image Playground API अपनाने वाले third-party apps में भी इस्तेमाल किया जा सकता है
Genmoji और Photos features
- Genmoji description डालकर नया emoji-जैसा image बनाने का फीचर है
- description डालने पर Genmoji और अतिरिक्त options दिखाई देते हैं
- photos के आधार पर friends या family के Genmoji बनाए जा सकते हैं
- इन्हें message में inline जोड़ा जा सकता है या sticker, Tapback reaction के रूप में share किया जा सकता है
- Photos search natural language को support करता है, जिससे specific scenes को अधिक सीधे ढंग से खोजा जा सकता है
- “Maya skateboarding in a tie-dye shirt” जैसी specific photo search संभव है
- video search clip के भीतर किसी खास moment को ढूँढकर संबंधित हिस्से पर सीधे ले जा सकता है
- नया Clean Up tool photo background में बाधा डालने वाली चीज़ों को पहचानकर हटाता है
- इसे इस तरह design किया गया है कि subject गलती से न बदले
- Memories में उपयोगकर्ता description डालता है, तो Apple Intelligence photos और videos चुनकर theme-based chapters वाली storyline बनाता है और उसे movie के रूप में व्यवस्थित करता है
- Apple Music से उस memory के अनुरूप songs के suggestions भी मिलते हैं
- उपयोगकर्ता की photos और videos device पर निजी रहती हैं और Apple या किसी अन्य व्यक्ति के साथ share नहीं की जातीं
Siri में बदलाव
- Siri अब Apple Intelligence के आधार पर system experience में और गहराई से integrated है
- इसकी language understanding क्षमता बेहतर हुई है, इसलिए उपयोगकर्ता अगर बोलते समय अटक भी जाए तो यह साथ बना रहता है और requests के बीच context बनाए रखता है
- उपयोगकर्ता Type to Siri कर सकते हैं और स्थिति के अनुसार text व voice के बीच switch कर सकते हैं
- Siri activate होने पर screen के किनारों को घेरने वाला नया light effect design दिखाई देता है
- यह iPhone, iPad, Mac के इस्तेमाल से जुड़े हज़ारों सवालों के जवाब भी दे सकता है
- Mail app में email schedule करना
- Light Mode से Dark Mode में switch करने जैसे सवाल संभालना
- screen awareness के ज़रिए यह मौजूदा screen की जानकारी से जुड़े actions कर सकता है
- Messages में मिले नए address को contact card में जोड़ सकता है
- यह Apple और third-party apps के अंदर और बाहर सैकड़ों नए actions कर सकता है
- Reading List में कोई specific article लाना
- शनिवार के barbecue की photos किसी खास व्यक्ति को भेजने जैसी requests संभालना
- यह उपयोगकर्ता की on-device जानकारी के आधार पर personalized requests भी संभाल सकता है
- यदि उपयोगकर्ता को याद न हो कि recommended podcast text में देखा था या email में, तब भी उसे ढूँढकर play कर सकता है
- flight information खोजकर real-time flight tracking से मिलान करके arrival time बता सकता है
privacy और Private Cloud Compute
- Apple Intelligence की संरचना इस आधार पर बनाई गई है कि वह व्यक्तिगत संदर्भ को समझते हुए भी उपयोगकर्ता की privacy की रक्षा करे
- कई models पूरी तरह on-device चलते हैं
- अधिक processing power की ज़रूरत वाले complex requests के लिए Private Cloud Compute का उपयोग होता है
- Apple silicon आधारित servers पर बड़े server models चलाए जाते हैं
- data को store या expose न होने देने के लिए design किया गया है
- स्वतंत्र experts Apple silicon servers पर चलने वाले code की जाँच करके privacy protection को verify कर सकते हैं
- Private Cloud Compute cryptographically यह सुनिश्चित करता है कि iPhone, iPad, Mac केवल उन्हीं servers से communicate करें जो publicly logged और inspectable software चला रहे हों
ChatGPT integration
- Apple ने ChatGPT access को iOS 18, iPadOS 18, macOS Sequoia के experience में integrated किया है
- उपयोगकर्ता अलग tool पर जाए बिना ChatGPT की expertise, image understanding और document understanding capabilities का उपयोग कर सकते हैं
- Siri ज़रूरत पड़ने पर ChatGPT का उपयोग कर सकता है
- question, document या photo को ChatGPT पर भेजने से पहले उपयोगकर्ता से permission माँगी जाती है
- permission के बाद Siri सीधे जवाब दिखाता है
- ChatGPT system-wide Writing Tools में भी उपलब्ध है
- Compose के ज़रिए लिखी जा रही content generate की जा सकती है
- ChatGPT image tools से अलग-अलग styles की images बनाकर लेखन को पूरक किया जा सकता है
- ChatGPT उपयोग के दौरान privacy protections शामिल हैं
- IP address छिपा दिया जाता है
- OpenAI requests को store नहीं करता
- यदि उपयोगकर्ता account connect करता है, तो ChatGPT की data usage policy लागू होती है
- ChatGPT integration इस साल के अंत में iOS 18, iPadOS 18, macOS Sequoia में GPT-4o आधारित रूप में उपलब्ध होगा
- account बनाए बिना free access मिलेगा
- ChatGPT subscribers अपना account connect करके paid features इस्तेमाल कर सकेंगे
उपलब्धता और supported devices
- Apple Intelligence उपयोगकर्ताओं को मुफ्त में उपलब्ध कराया जाएगा
- इस पतझड़ में iOS 18, iPadOS 18, macOS Sequoia के beta के रूप में उपलब्ध होगा, और शुरुआती भाषा U.S. English होगी
- कुछ features, software platforms और अतिरिक्त भाषाएँ अगले वर्ष के दौरान उपलब्ध कराई जाएँगी
- supported devices इस प्रकार हैं
- iPhone 15 Pro
- iPhone 15 Pro Max
- M1 या उसके बाद के chip वाले iPad और Mac
- इसे उपयोग करने के लिए Siri और device language, दोनों U.S. English पर set होने चाहिए
- अतिरिक्त जानकारी apple.com/apple-intelligence पर उपलब्ध है
1 टिप्पणियां
Hacker News की राय
आज Apple ने जो personal AI फीचर्स दिखाए, वे सच में प्रभावशाली थे
इससे दिखता है कि consumer AI की असली ताकत उन platform owners के पास है जिनके हाथ में पहले से ही हमारी digital life का बड़ा हिस्सा—messages, mail, photos, apps—है, यानी Apple या Google, और काम/जीवन के पक्ष में Microsoft
Siri जिस तरह email और messages के context के आधार पर calendar, bookings, flight confirmations जैसे काम करती है, वह वाकई उपयोगी लगता है। मुझे लगा था कि personal intelligence वाले फीचर्स कभी न कभी आएंगे, लेकिन Apple इतनी जोरदार एंट्री करेगा, यह उम्मीद नहीं थी; ecosystem में लोगों को खींच लाने का असर बड़ा है
Private Cloud, ChatGPT integration, image generation playground, Genmoji तक का ध्यान रखना भी अच्छा लगा, और यह Craig के कहे “हम सभी के लिए” फीचर बन सकता है। हालांकि असली लोगों की image generation uncanny valley के बहुत करीब लगती है, इसलिए अगर मुझे ऐसी ठंडी और बेदिल-सी दिखने वाली birthday greeting image मिले, तो शायद खुशी न हो
AI convergence शायद पिछली technological shifts की तुलना में संगठनात्मक खामियों को कहीं ज्यादा खुलकर सामने लाएगा। कोई भी ऐसा generative AI नहीं चाहता जो सिर्फ Gmail में चले, और कोई दूसरा AI जो सिर्फ Messages में चले; लोग ऐसा platform feature चाहते हैं जो हर जगह काम करे जहां वे text लिखते हैं
अभी मुझे नहीं पता कि Google या Microsoft संगठनात्मक रूप से ऐसा दे पाएंगे या नहीं
Private computing भी बहुत अहम लगता है। भारी computation को cloud servers पर करने जैसे obvious use cases के अलावा, यह personal code interpreter—यानी iOS पर ठीक-ठाक scripting संभव होने—और लंबी अवधि में iPadOS पर development की अनुमति देने का रास्ता बन सकता है
Apple का servers में भी अपने chips इस्तेमाल करना महत्वपूर्ण है। सही सवाल यह नहीं कि “क्या यह काफी है”, बल्कि यह है कि developer side और hardware side पर इसे NVIDIA level तक ले जाने के लिए वे क्या करेंगे
लगता है लोग अभी इस बड़े खेल को समझ नहीं रहे, क्योंकि वे सिर्फ यह देख रहे हैं कि Apple को cutting-edge model race में उतरना चाहिए या नहीं। अब वह headline समझ आती है कि Nadella Apple और OpenAI की partnership से चिंतित थे
सबसे अहम सवाल reliability का है। क्या यह हर बार सही से काम करेगा, या content को बुरी तरह गलत समझकर उस user को awkward स्थिति में डाल सकता है जिसने इस पर भरोसा किया
https://www.theguardian.com/us-news/2024/apr/16/house-fisa-g...
Search और Siri improvements को छोड़ दें, तो Apple ने यहां जो generative features प्रस्तावित किए हैं, वे कितने उपयोगी होंगे, यह मुझे साफ नहीं है
अगर आप किसी के birthday के लिए एक घंटा लगाकर drawing बनाकर भेजते हैं, तो receiver को जो value महसूस होती है उसका बड़ा हिस्सा drawing की quality नहीं, बल्कि यह है कि आपने इतनी मेहनत और समय लगाकर सिर्फ उस व्यक्ति के लिए एक unique result बनाया। खुद बनाई चीज इस्तेमाल करने और खरीदी हुई चीज इस्तेमाल करने की संतुष्टि में फर्क भी कुछ ऐसा ही है
Tania ने कुछ seconds में जो AI images बनाई, वे शुरू में मजेदार लग सकती हैं, लेकिन जल्दी ही chat screen भरने वाला spam बन जाएंगी और शायद कुछ भी जोड़ नहीं पाएंगी। बच्चे के लिए उसे ही hero बनाकर bedtime story तुरंत बना देना भी ऐसा ही है
ऐसी दुनिया में जहां कुछ भी हासिल किया जा सकता है, हर चीज की value शून्य हो जाती है
कल burrito लेने drive करते समय मैंने story की पूरी introduction सहित detailed points gpt-4o को dictate किए, और उस context के आधार पर नया adventure सुनाने को कहा, तो उसने कमाल कर दिया। मैं mirror में बच्चे की प्रतिक्रिया देख पा रहा था, और इसने हमने जो पहले से बनाया था उसे नुकसान नहीं पहुंचाया। उल्टा, खुद कहानी सुनाते समय इस्तेमाल करने के लिए नए ideas दे दिए
अगर generative AI पर अपनी व्यक्तिगत और creative contribution के बिना निर्भर किया जाए, तो दिलचस्प result नहीं निकलेगा; लेकिन जो लगातार बनाया और जोड़ा गया है उसके ऊपर generative AI रखा जाए, तो बहुत शानदार result मिल सकता है
इस मायने में generative AI ऐसा लगता है जैसे piano या organ तक सीमित रहने के बाद synthesizer भी मिल गया हो—एक और tool जिसे practice के साथ और बेहतर इस्तेमाल किया जा सकता है
आज भी handwritten card भेजने से कोई रोकता नहीं, और बेशक उसकी ज्यादा कद्र होती है, लेकिन लोग texts की भी सराहना करते हैं। खासकर जब लोग दूर हों या रिश्ता बहुत गहरा न हो
जैसे-जैसे gift देना आसान होगा, context और ज्यादा महत्वपूर्ण हो जाएगा
AI spam, खासकर custom emoji और stickers, दोबारा इस्तेमाल होंगे या single-use plastic की तरह बिखेर दिए जाएंगे—यह देखना दिलचस्प होगा
डेमो वैसा लगा जैसा ChatGPT आने से पहले लोग AI की कल्पना करते थे। यह personalised था, context समझता था, और पूरे system में गहराई से integrated interaction का तरीका था
server की जरूरत वाले AI tasks को संभालते हुए भी requests को जितना हो सके private रखने की उनकी व्याख्या भी अच्छी थी। अगर यह Apple hardware पर चलने वाला और audit किया जा सकने वाला server software है, तो ऐसे कामों के लिए यह लगभग सबसे अच्छा विकल्प लगता है; open source हो तो और बेहतर होगा
मां द्वारा भेजे गए email के content के आधार पर Siri का “मां” के context को समझने वाला demo वही दृश्य था जिसकी हम AI दुनिया में कल्पना करते थे। model की अपनी pure AI क्षमता शायद किसी दिन commoditized हो जाएगी, और अब अहम बात उस model का इस्तेमाल करने वाला hardware और पूरे system का integration है
actual release के बाद का experience अलग बात है, लेकिन vision भर से ही यह प्रभावशाली था और Apple एक बार फिर user experience को समझता दिखा। इस announcement के implications ऊपर से दिखने से कहीं बड़े हो सकते हैं, और खासकर बुजुर्गों के लिए computing को आसान बनाने की संभावना उत्साहित करती है
AI “हर तरह के काम कर सकता है” वाला demo शानदार बनाना आसान है, लेकिन अगर real world में यह अक्सर टूटता है तो आखिरकार यह मौजूदा Siri जैसा ही बन जाता है। 12 साल पहले का यह विज्ञापन याद रखना चाहिए: https://www.youtube.com/watch?v=sw1iwC7Zh24
उस समय किए गए वादों में से आज भी कई चीजें Siri पर भरोसे से छोड़ना मुश्किल है
Apple ने AI functions के लिए purpose-specific graphical interfaces काफी अच्छे से दिए हैं, और आगे यह कैसे और गहरा होता है, देखना दिलचस्प होगा
आप चाहेंगे कि यह मेरी जिंदगी को समझे, और event या कई सवालों के जवाब देने के लिए हर device को मेरा context बना पाना होगा; इससे “अगर मैं चाहता हूं कि Siri मेरे देखे जाने वाले programs भी जाने, तो क्या Chromecast की जगह Apple TV खरीदना होगा?” जैसी सोच पैदा हो सकती है
iPhone की कीमतें लगातार बढ़ रही हैं, और इस ecosystem में गहराई तक जाने के बाद high-performance computation असल में वसूली जैसा महसूस हो सकता है। क्योंकि Apple दुनिया छोड़ना लगभग असंभव हो जाएगा
competitors के पास भी इतने integrated systems नहीं हैं, इसलिए उनके लिए सब कुछ इसी स्तर पर integrate करना कठिन होगा
branding के नजरिए से यह परफेक्ट है। कंपनी के नाम के अक्षरों की तरह “छोटी दिखने वाली” चीज दशकों बाद बड़ा असर डाल सकती है
AI == Apple Intelligence के रूप में इसे अपने नाम किया जा सकता है, और आखिर का “AI for the rest of us” इस पल को अच्छी तरह पकड़ता है और लगता है Apple आगे कहां जाएगा इसका इशारा देता है
Apple शायद casual users द्वारा creative या मजेदार images, emoji, text work और quality-of-life improvements के लिए इस्तेमाल होने वाले विशाल scale को संभालने की expertise बनाएगा। भले ही वह नई AI technologies के cutting edge पर खड़ा होकर उन्हें सीधे user features में integrate न करे, इस अनोखे scale को support करने के लिए उसे उसी technology के cutting edge के करीब जाना होगा
इस बार का WWDC प्रभावशाली था, और Mac Studio, Mac Pro, M3 Ultra, M4 Ultra, M3/M4 Extreme की खबर न होना मुझे curious लगा। मैंने अनुमान लगाया था कि वे अपने M2 Ultra आदि को cloud compute capacity के लिए इस्तेमाल करेंगे, और सच में उसका जिक्र हुआ, यह दिलचस्प था; अब देखना है कि इस तरफ और details आती हैं या नहीं
एक तरफ ऐसा लगता है कि वे कह रहे हैं “हम इसका मालिकाना हक रखते हैं”, लेकिन दूसरी तरफ वे अपने control से बाहर के brand को जोड़ रहे हैं। उम्मीद है लोग इसे ApI कहकर छोटा नहीं करेंगे। वरना API search results दूषित हो जाएंगे
जब तक इसे सचमुच काम करते नहीं देखता, मैं skeptical हूं
एक तरफ Apple का privacy protection और on-device processing में अच्छा track record है, लेकिन इस announcement में बहुत सारी बातें अस्पष्ट थीं। किस criteria पर यह cloud में run होता है, personal model कई devices पर कैसे इस्तेमाल होता है, क्या इसका मतलब है कि वह थोड़ी देर के लिए cloud में चला जाता है, guest mode में यह कैसे अलग होता है—यह साफ नहीं है
“OpenAI requests store नहीं करता” जैसी wording भी जानबूझकर opaque लगती है। मुझे उम्मीद थी कि Apple कई devices को साथ इस्तेमाल करके requests process करने वाली federated learning जैसी approach अपनाएगा, लेकिन लगता है आखिरकार Occam’s razor ही जीता है, इसलिए देखेंगे
beta में हम देखेंगे कि Apple की बात असल में कैसे implement होती है, लेकिन मैं beta से दूर रहूंगा। थोड़ा अफसोस जरूर है, पर अभी ambiguity Apple के पक्ष में काम कर रही है। overpromise करके underdeliver करने से बेहतर है कम promise करना और ज्यादा deliver करना
अगर मैंने सही समझा है, तो इसमें तीन चीज़ें हैं: 1) device पर चलने वाला AI, 2) Apple servers का इस्तेमाल करने वाला AI, 3) ChatGPT/OpenAI service या भविष्य में किसी और service का इस्तेमाल करने वाला AI
1 वाला अगर तय करता है कि अतिरिक्त processing power चाहिए, तो 2 पर चला जाता है, और 3 सिर्फ़ तब call होता है जब user साफ़ तौर पर अनुमति देता है—संरचना ऐसी ही लगती है
नीचे जैसा बताया गया है, बाद में दूसरे providers भी जोड़े जाने वाले हैं
अच्छा होगा अगर यह simple standard API वाले किसी भी server को support करे, ताकि self-hosted Llama 3 या अगले 6–12 महीनों में आने वाली कोई चीज़ चला सकें
जैसे sports records या जानकारी, फिल्मों और उनसे जुड़ी जानकारी जैसी चीज़ें देखनी हों, तो इसे इस्तेमाल करने जैसा लगता है
मेरी जानकारी में, 1 तब 2 पर जा सकता है जब सरकार personal data मांगे या Apple के advertising model को personalization के लिए sensitive details चाहिए हों
दूसरे thread में भी कहा था, image generation का शामिल होना और उसे इतनी ज़्यादा attention मिलना काफ़ी खटकता है
अगर लोग important information को source verify किए बिना मानने लगें, तो reliability चिंता की बात है—मसलन flights के मामले में यह खराब स्थिति तक ले जा सकता है
फिर भी features की polish और practical usefulness दिलचस्प है। शायद सबसे flashy चीज़ न हो, लेकिन जो दिखाया गया वे सच में काम की चीज़ें हैं। Siri जब भी समझे कि ChatGPT उपयोगी होगा, तब उसका optional होना भी अच्छा है
सबसे बड़ा सवाल यह है कि online components बंद किए जा सकते हैं या नहीं, और अगर कुछ local पर process नहीं हो सकता तो क्या होता है। servers में वही chip इस्तेमाल होने की बात से यह भी जानना चाहूंगा कि model local पर चल नहीं पाता, या वजह context है
यह भी साफ़ नहीं दिखता कि बात पूरे feature level की है या कुछ specific requests की, और इसका मतलब यह भी हो सकता है कि समय के साथ hardware के हिसाब से local और cloud processing का स्तर बदलता रहेगा
एक चीज़ गायब दिखती है। photorealistic style नहीं है
यह अच्छा विकल्प लगता है। हर चीज़ को और अधिक memes और emoji में cartoon बना देना मुझे बहुत पसंद नहीं, लेकिन कम-से-कम यह साफ़ तौर पर काल्पनिक है और “fun” की तरफ़ झुकता है। बच्चों को भी पसंद आएगा और adults को भी आ सकता है
फिर भी लोग बहुत inappropriate चीज़ें बना पाएंगे, इसलिए controversy होगी, लेकिन risk level कम हो जाता है
इसलिए answer सही है या नहीं, जल्दी check किया जा सकता है। यह semantic search के करीब है, बस results को अधिक flexible text में explain करने का तरीका है
Apple ने ज़रूरत के चलते servers को एक stopgap की तरह जोड़ा है, लेकिन ideal स्थिति शायद वह होगी जब उनके बेचे गए सभी devices पर्याप्त समय तक सब कुछ local पर चला सकें और servers बंद किए जा सकें
यह शायद कभी न भी आए। large language models resource-rich languages से दूर जाते ही तेज़ी से fail होने लगते हैं
यह सच में बहुत बढ़िया दिखता है
कहा गया कि model Apple Silicon-based private cloud compute तक scale कर सकता है, और user device “publicly verifiable software” चलने की पुष्टि करता है ताकि data misuse रोका जा सके
server-side code open source होगा या नहीं, यह जानना चाहूंगा। अगर ऐसा हुआ तो यह pleasantly surprising होगा। आगे यह कैसे evolve होगा, देखना दिलचस्प रहेगा
अगर यह advertised तरीके से काम करता है तो सीधे “shut up and take my money” वाली बात हो जाएगी। Siri आखिरकार वैसी बनती दिख रही है जैसी उसे होना चाहिए था, और यह भी उत्सुकता है कि क्या Shortcuts Actions catalog के ऊपर इसे रखकर शुरुआत से ही possible actions का scope बढ़ाया जा रहा है
Apple Photos और system के दूसरे हिस्सों में integrate होने वाली image और emoji generation functionality भी सच में शानदार दिखती है। Mac/iPad के लिए M1 या उससे ऊपर, और iPhone के लिए 15 Pro चाहिए लगता है
service integration existing models इस्तेमाल करता है, और ऐसा लगता है जैसे AppleScript से चली आ रही API को large language model या Stable Diffusion family systems तक expand किया जा रहा हो। हालांकि games और cloud push की वजह से लगता है कि वे M4 को जितनी जल्दी हो सके आगे बढ़ाना चाहते हैं
on-device model जब तय करता है कि “इसका जवाब ChatGPT बेहतर दे सकता है”, तो user से पूछता है कि इस्तेमाल करना है या नहीं। description से लगा कि समय के साथ दूसरे models भी plug in किए जा सकेंगे
खासकर ChatGPT 4o, OpenAI account बनाए बिना free में इस्तेमाल किया जा सकता है
क्या इसका मतलब है कि client cryptographically verify कर सकता है कि server पर कौन-सा code चल रहा है? अगर हां, तो यह इस use case के बाहर भी बेहद दिलचस्प और उपयोगी है
“private cloud compute” में आखिर ठीक-ठीक क्या compute हो रहा है, यह स्पष्ट नहीं है
“क्या इस काम के लिए ChatGPT इस्तेमाल कर सकते हैं?” पूछने वाला हिस्सा बहुत कच्चा और Apple जैसा नहीं लगा
पुराना मुहावरा है, लेकिन लगता है Steve Jobs कब्र में करवट बदल लेते। सच कहूँ तो समझ नहीं आया कि इसकी जरूरत क्यों है
क्या वे पर्याप्त consistent integration नहीं बना पाए? अगर ऐसा है, तो क्या बाकी हिस्सा ChatGPT आधारित नहीं है? फर्क क्या है? user के नज़रिए से यह काफी उलझाने वाला है
on-device AI में सबसे अच्छा बनना एक बहुत बड़ा market opportunity है। सब कुछ खुद करने की कोशिश करना उतना ही बेवकूफी भरा है जितना Safari को Google search homepage partnership के बिना लॉन्च करना
Apple on-device processing और पूरे platform पर user experience में AI को पिरोने वाली अपनी ताकत पर focus कर सकता है, और privacy से समझौता भी नहीं करना पड़ता। और AI search query जैसे क्षेत्रों में, जहाँ बड़े external server farms और internet access के लिए data बाहर भेजना पड़ता है, market leader का फायदा उठाया जा सकता है
अगर system यह नहीं कहता कि “जवाब पाने के लिए मैं किसी दोस्त को phone करूँगा,” तो इसका मतलब है कि यह 100% local है या सबसे खराब स्थिति में भी पूरी तरह private तरीके से audited Apple Intelligence के अंदर ही रहता है
अगर आप banana bread recipe पूछ रहे हैं तो ChatGPT पर जाना ठीक हो सकता है, लेकिन शायद आप ज्यादा personal जानकारी नहीं भेजना चाहेंगे
और खास तौर पर “क्या OpenAI मेरा personal data या questions देखता है?” का जवाब है: “जब तक आप OpenAI से बात करने की अनुमति नहीं देते, सब कुछ iPhone या Private Compute पर process होता है”
बल्कि अगर वह confirmation prompt flow को रोककर यह साफ न करता कि ChatGPT result कब लाया जा रहा है, तो मैं नए AI features इस्तेमाल करने में हिचकिचाता
यह सच में शानदार दिखता है
उन्होंने कहा कि model Apple Silicon आधारित private cloud compute तक scale हो सकता है, और user device “publicly verifiable software” के execution को verify करके data misuse रोकता है
उत्सुकता है कि server-side code open source होगा या नहीं। अगर हुआ, तो यह सुखद surprise होगा। आगे यह कैसे evolve होगा, यह देखने की उत्सुकता है
अगर यह advertised तरीके से काम करता है, तो यह सीधे “चुप रहो और मेरे पैसे ले लो” वाला मामला होगा। Siri आखिरकार वैसी बनती दिख रही है जैसी उसे होना चाहिए था, और यह भी जानना चाहूँगा कि क्या Shortcuts Actions catalog के ऊपर बनाकर शुरुआत से ही possible tasks का दायरा बढ़ाया जा रहा है
Apple Photos और system के दूसरे हिस्सों में integrate होने वाले image और emoji generation features भी सच में शानदार दिखते हैं। Mac/iPad के लिए M1 या उससे ऊपर, और iPhone के लिए 15 Pro चाहिए लगता है