- Apple Intelligence के पास on-device processing और Private Cloud Compute जैसी मजबूत नींव है, लेकिन असली product experience रचनात्मकता में मदद करने वाली “mind की bicycle” से ज्यादा tech demo जैसे सुधारों के करीब है
- Apple ने Siri की personal context understanding का वादा किया था, जैसे “कुछ दिन पहले पत्नी ने भेजा था वह podcast चलाओ”, लेकिन विज्ञापनों में बार-बार दिखाया गया core feature अभी तक रिलीज़ नहीं हुआ है
- Private Cloud Compute user data deletion, node verification, public OS images और security-critical code को public करने के साथ remotely verifiable trusted computing का दुर्लभ उदाहरण बन गया, लेकिन उसके ऊपर बने features उम्मीदों पर खरे नहीं उतरे
- वास्तविक features में Math Notes Notes के अंदर variable-based calculations तुरंत कर देता है और सबसे संतोषजनक है, लेकिन Writing Tools, notification summaries, Clean Up और Image Playground में usefulness, accuracy और creative control की कमियां दिखती हैं
- Generative AI किसी standalone product से ज्यादा किसी बड़े product की implementation detail जैसा है, और Apple Intelligence उसी device पर Ollama से direct integration करने के तरीके से भी कम उपयोगी महसूस होता है
“mind की bicycle” वाली Apple product philosophy
- Steve Jobs ने 1981 में computer की तुलना मानव मन के लिए bicycle से की थी, उसे ऐसा tool माना था जो कम ऊर्जा में ज्यादा creativity संभव बनाता है
- Macintosh और MacWrite ने typewriter या handwriting के उलट, print करने से पहले screen पर document देखने और Backspace से edit करने की सुविधा दी
- Word processor ने document writing का तरीका काफी बदल दिया, और Apple products ने यह मानक स्थापित किया कि वे सिर्फ calculation machines नहीं, बल्कि creation को सक्षम बनाने वाले शरीर के extension की तरह काम करें
- इस कसौटी पर Apple “computer का काम करने वाले computer” से ज्यादा creative tools बेचने वाली company के रूप में अलग दिखती है
Apple Intelligence ने जो vision वादा किया
- Apple ने जून 2024 में Apple Intelligence की घोषणा की और इसे smartphone को ज्यादा smart बनाने वाले features के bundle के रूप में पेश किया
- Siri द्वारा “कुछ दिन पहले पत्नी ने भेजा था वह podcast चलाओ” जैसे request को handle करने का उदाहरण relationships, links और app context को जोड़ने वाली personal context search की संभावना दिखाता है
- अगर यह vision सच हो जाए, तो user कई apps में बिखरी अपनी digital life को natural language से search कर सकेगा और phone उसकी तरफ से काम कर सकेगा
- Apple ने ऐसा विचार रखा जिसमें Spotify जिस तरह music देता है और AWS API जिस तरह compute को tap की तरह उपलब्ध कराता है, उसी तरह सभी Apple devices intelligence तक पहुंच पाएंगे
- यह दिशा computer को user के साथ मिलकर मनचाहा काम कराने वाली “mind की bicycle” vision के करीब है
Modern apps users को अपने data से कैसे दूर करती हैं
- Modern apps की बड़ी समस्या यह है कि कई apps web services की पतली shell की तरह काम करती हैं
- Instagram या Bluesky जैसे apps server को request भेजते हैं, response लेते हैं और content दिखाते हैं
- Signal न हो तो posts schedule करना, पहले देखी गई posts check करना, या अभी-अभी post किए content को देखना भी मुश्किल हो सकता है
- अपवाद के तौर पर Signal और Apple apps का जिक्र है, और इनके अलावा कई apps users को उनके अपने data से धीरे-धीरे दूर करती हैं
- Ed Zitron का लेख आलोचना करता है कि platforms growth और monetization के लिए ad trackers, video ads और notification requests जैसी चीजों से user experience को कुतरते हैं
- Market chat या social media के लिए सीधे पैसे देना नहीं चाहता, और ऐसे services चलाने की cost बहुत बड़ी होती है, इसलिए user data आसानी से monetization target लगने लगता है
Private Cloud Compute नाम की मजबूत नींव
- Apple Intelligence जहां संभव हो device पर चलता है, और Apple large language models तथा AI models को device पर चलाने के लिए research भी कर रहा है
- Device या user को दिख सकने वाले hardware पर processed computation, external requests शामिल करने वाले तरीके की तुलना में privacy के लिहाज से कहीं ज्यादा मजबूत है
- Apple ने WWDC में दावा किया कि Private Cloud Compute network requests के लिए भी local device computation जैसी या उससे भी मजबूत privacy guarantees देता है
- सामान्य web service operations के experience से देखें तो Private Cloud Compute को कई बहुत कठिन conditions एक साथ पूरी करनी होती हैं
- User data केवल request process करने के लिए इस्तेमाल होता है और उसके बाद delete कर दिया जाता है
- Load balancing infrastructure यह नहीं जानता कि request किसने की और वह किस server पर जा रही है
- Researchers system की inspection और verification कर सकते हैं और laptop पर उसका simulation चला सकते हैं
- Apple SRE staff के पास Private Cloud Compute nodes पर privileged access नहीं है, और logging compiler level पर minimize की गई है
- Attackers किसी specific user की request process करने वाले node का reliably पता नहीं लगा सकते
Public security model और बंद ecosystem के दो पहलू
- Apple का technical document AI product teams द्वारा एक consistent security model public करने के दुर्लभ उदाहरणों में गिना जाता है
- Hardware assembly process में unauthorized hardware को server board में जोड़े जाने के खतरे को रोकने के लिए हर stage पर X-ray लेकर baseline image से compare किया जाता है
- Users Private Cloud Compute node की local copy configure करके attack experiments कर सकते हैं, और Apple vulnerability मिलने पर bounty देता है
- Hardware certification में Apple के अंदर कई unrelated departments के लोग शामिल होते हैं
- Private Cloud Compute nodes से power हटने पर वे अपनी certification खुद revoke कर देते हैं, और server chassis intrusion switch main power से जुड़ा होता है, इसलिए server खोलते ही power कट जाती है और node certification revoke हो जाती है
- Device जब Private Cloud Compute को request भेजता है तो इस्तेमाल हुआ node ID record होता है, और user check कर सकता है कि device ने जिस node का इस्तेमाल किया वह अभी भी certified state में है या नहीं
- Production OS images public download के लिए उपलब्ध हैं और encrypted नहीं हैं
- OS के important packages code और data में अलग किए जाते हैं, और data package में code या code package में data मिलाया नहीं जा सकता
- Apple ने Private Cloud Compute के security-critical हिस्सों का source code GitHub पर public किया है
- यह system remotely verifiable trusted computing के Holy Grail के करीब है, लेकिन अगर इसे consumer OS के रूप में दिया जाए तो यह root access, compiler और debugger के बिना केवल तय software चलाने वाला बेहद बंद system बन जाता है
2024 के अंत में सचमुच आए features
- Apple Intelligence का पहला feature bundle अक्टूबर 2024 के अंत में release हुआ
- दिए गए features में Writing Tools, notifications, web pages और emails के summaries, photos से objects हटाने वाला Clean Up, photo content-based search, Siri की device document search और Notes app का Math Notes शामिल थे
- बाद में Image Playground और email categorization जोड़े गए
- Ads में बार-बार दिखने वाला personal context feature अभी तक release नहीं हुआ है
Math Notes: सबसे सफल feature
- Math Notes को Apple Intelligence features में सबसे संतोषजनक feature माना गया है
- Notes app में नीचे जैसी variable-based calculation डालने पर यह आखिरी equals sign के बाद result अपने-आप डाल देता है
Rent = 2300
FamilySize = 2
Rent / FamilySize =
- ऊपर वाला example
1150 insert करता है
- Basic calculations, variables के इस्तेमाल और income-expense के rough estimates में उपयोगी है
- Math Notes को लेकर कोई शिकायत नहीं है, ऐसा आकलन है
Writing Tools: creation में मदद से ज्यादा उसे replace करने वाला परिणाम
- Writing Tools writing experience वाले users के लिए लगभग बेकार है, और जो result वे खुद बेहतर बना सकते हैं उसका थोड़ा खराब version ही देता है
- यह feature creative process में जोड़ता नहीं, बल्कि उसे replace करने वाले मौजूदा AI tools का खराब side effect महसूस कराता है
- Results layers या fine-grained adjustment की संभावना के बिना “professional बनाएं”, “table में बदलें” जैसे सीमित options के पीछे opaque text blocks के रूप में आते हैं
- असल में paragraph summary मांगने पर “Writing Tools Unavailable: Certain capabilities are unavailable at this time. Try again later.” error आया
- Streaming के दौरान लंबी बातों को article के starting outline में बदलने में यह उपयोगी हो सकता है, लेकिन article खुद लिखने का काम करने के लिए सही नहीं है
- जिन्हें English का experience ज्यादा नहीं है, उनके लिए यह अधिक उपयोगी हो सकता है, लेकिन author के लिए इसकी usefulness बहुत ज्यादा नहीं है
Notifications, messages और email summaries की समस्या
- Notification summaries का idea अपने आप में अच्छा लगता है, क्योंकि यह कई notifications को एक साथ जल्दी scan करने लायक बनाता है
- वास्तविक implementation में failures बहुत साफ दिखते हैं
- Scam text message “address information incomplete होने से parcel delivery delayed” जैसा summarize हो सकता है, जिससे तुरंत action लेने की जरूरत महसूस हो सकती है
- BBC ने एक case report किया जिसमें notification summary ने लोगों को यह सोचने पर मजबूर कर दिया कि custody में मौजूद suspect ने खुदकुशी कर ली
- Apple Intelligence on रखकर सिर्फ notification summaries disable करने पर notifications अधिकतम 5 seconds delayed हो सकते हैं
- Summary features के कुछ हिस्से iPhone पर काम नहीं कर रहे थे, और उपयोगी न होने के कारण MacBook पर केवल notification delay रोकने के लिए on छोड़े गए
- कुल मिलाकर इसमें Apple जैसी polish है, लेकिन आधा-अधूरा बना हुआ महसूस होता है
Clean Up: photos की reality बदलने वाला tool
- Clean Up photos से unwanted objects हटाने वाला feature है
- Photos को reality के as-is reflection के रूप में देखने और color correction या crop जैसे expression बदलने वाले काम तथा image के content को बदलने वाले काम में फर्क करने वाले नजरिए से इसे स्वीकार करना मुश्किल है
- Stalin की photo से Nikolai Yezhov को हटाने वाला ऐतिहासिक editing case Clean Up की प्रकृति समझाने के example के रूप में इस्तेमाल किया गया
- यह tool image को उस पल जैसा बना सकता है जो वास्तव में हुआ था, नहीं बल्कि जैसा user चाहता था
- इन philosophical reasons के चलते Clean Up का इस्तेमाल नहीं किया गया और इसका ज्यादा detail में evaluation नहीं किया गया
Image Playground: Apple product जैसा न लगने वाला output
- Image Playground text prompts और लोगों की photos आदि से images generate करने वाला feature है
- Stable Diffusion 1.5, ComfyUI और 11–12 models को मिलाने वाले complex diffusion flow से बनी image को high-standard example के तौर पर पेश किया गया
- Image Playground से बनाई गई East Berlin TV tower sunset image phone screen पर सरसरी तौर पर देखने पर चल सकती है, लेकिन sky में time-of-day mix हो जाता है और windows तथा deck की straight lines अजीब लगती हैं
- अच्छे examples बहुत छांटे हुए results हैं, और ज्यादातर “taco smoking beer at a party” जैसे form और meaning में काफी mismatch हो सकते हैं
- अपनी photo इस्तेमाल करने पर body proportions और eyes आदि में unsettling results आ सकते हैं
- Apple ने ऐसे outputs को released product के रूप में पेश किया, यह Apple से अपेक्षित quality और care के उलट महसूस होता है
- Genmoji को भी इसी तरह soulless और hollow results बनाने वाला बताया गया है, लेकिन chat messages से quality बनाए रखते हुए extract करना मुश्किल होने के कारण detail में नहीं लिया गया
- Open-weights models इस्तेमाल करने वाली दूसरी companies बेहतर results बना सकती हैं, और Apple की तरफ developers के लिए models को creatively use करने वाला IntelligenceKit जैसा tool न होना खलता है
Generative AI product नहीं, implementation detail है
- Generative AI अपने-आप में product से ज्यादा किसी बड़े product के अंदर इस्तेमाल होने वाली implementation detail के करीब है
- Berlin TV tower की image 1–2 seconds में generate करने पर भी user को sky color correction जैसी layer editing या creative control नहीं मिलता, सिर्फ single final output मिलता है
- ऐसे features low-effort social media posts में इस्तेमाल हो सकते हैं, लेकिन product से ज्यादा tech demo जैसे हैं, और 2025 के हिसाब से यह ऐसी चीज है जो 2022 में आती तो ही चौंकाती
- Generative AI वास्तव में जिन क्षेत्रों में उपयोगी है, वे कम flashy tasks हैं
- Meditation experience में दिखने वाली मुश्किल-से-समझाई जा सकने वाली sensations को generative AI से classify करने की एक research case का जिक्र है, और जून तक इससे जुड़ी खबरों और paper publication की योजना है
अंतिम आकलन: मजबूत नींव पर कमजोर product
- Apple Intelligence को implementation के नजरिए से failed product माना गया है
- नींव बहुत मजबूत है
- जितना संभव हो उतना data device पर process होता है
- जो tasks device पर process नहीं हो सकते, वे Private Cloud Compute की मजबूत security practices इस्तेमाल करते हैं
- जहां तक संभव हो private और encrypted processing का लक्ष्य है
- समस्या यह है कि remotely verifiable trusted computing के Holy Grail जैसी नींव बनाने के बावजूद, end-user experience उसी device पर Ollama से direct integration बनाने से भी कमजोर महसूस होता है
- Ollama इस्तेमाल करने पर Apple Intelligence से कहीं बेहतर models चुने जा सकते हैं, और वे उसी device पर चलते हैं इसलिए privacy भी बनी रहती है
- Open-source community को limited hardware से maximum performance निकालनी पड़ती है, इसलिए withered technology का lateral thinking अपनाकर outputs बना सकती है और उन्हें बिना modification production में deploy कर सकती है
- Apple Intelligence ने “mind की bicycle” नहीं, बल्कि tech demo जैसे peripheral improvements दिए, और जो potential लगभग infinite लगता था, वह बरबाद हुआ-सा result निकला
- अपवाद Math Notes है, जिसे इतना strongly positive माना गया है कि काश यह दूसरे note apps में भी होता
अभी कोई टिप्पणी नहीं है.