3 पॉइंट द्वारा GN⁺ 4 시간 전 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Apple Intelligence को VoiceOver, Magnifier, Voice Control और Accessibility Reader में लागू किया गया है, जिससे image description, natural language navigation और reading assistance बेहतर होती है
  • VoiceOver और Magnifier, Image Explorer और Live Recognition के साथ कैमरा स्क्रीन में दिख रही चीज़ों के बारे में सवाल-जवाब कर सकते हैं, लेकिन high-risk स्थितियों में इन पर निर्भर नहीं होना चाहिए
  • Voice Control सटीक label या number की बजाय “tap the purple folder” जैसे natural language commands के ज़रिए iPhone और iPad navigation में मदद करता है
  • बिना caption वाले वीडियो में device पर ही generated captions अपने-आप दिखाए जाएँगे, और यह iPhone, iPad, Mac, Apple TV और Apple Vision Pro पर उपलब्ध होगा
  • Apple Vision Pro, eye tracking से Tolt और LUCI alternate driving systems को नियंत्रित कर सकता है, और Hikawa Grip & Stand भी दुनिया भर में लॉन्च किया जा रहा है

रिलीज़ शेड्यूल और privacy

  • नई सुविधाएँ और Apple Intelligence आधारित अपडेट इस साल के अंत तक उपलब्ध होने की उम्मीद है
  • Apple का कहना है कि accessibility features में Apple Intelligence लागू करते समय भी वह privacy by design सिद्धांत को बनाए रखेगा
  • Hikawa Grip & Stand for iPhone, Apple Store online पर तीन नए रंगों में लॉन्च किया गया है

VoiceOver और Magnifier में visual information navigation

  • VoiceOver और Magnifier, vision impairment या low vision वाले users के लिए screen information और आसपास के environment को अधिक विस्तार से समझाते हैं
  • VoiceOver का Image Explorer, Apple Intelligence की मदद से photo, scanned bill, personal records जैसी system-wide images के description देता है
  • Live Recognition update के साथ VoiceOver users, iPhone के Action button को दबाकर camera viewfinder में दिख रही चीज़ों के बारे में सवाल पूछ सकते हैं और जवाब पा सकते हैं
  • user अपनी भाषा में follow-up सवाल जारी रखकर और अधिक visual information समझ सकते हैं
  • Magnifier, low vision users के लिए high-contrast interface में वही assisted navigation और visual description features देता है
  • Magnifier भी Action button के साथ काम करता है, और “zoom in”, “turn on flashlight” जैसी voice requests से app को नियंत्रित किया जा सकता है
  • VoiceOver और Magnifier पर ऐसी स्थितियों में निर्भर नहीं होना चाहिए जहाँ किसी को चोट या नुकसान हो सकता हो, high-risk परिस्थितियाँ हों, navigation की ज़रूरत हो, या medical condition का diagnosis या treatment करना हो

Voice Control में natural language input

  • Voice Control, Apple Intelligence का उपयोग करके physical disabilities वाले users को सिर्फ़ आवाज़ से iPhone और iPad को अधिक सहज तरीके से navigate करने देता है
  • नई flexible input feature, सटीक label या number के बजाय screen पर मौजूद button और controls को natural language में बताकर operate करने देती है
  • “say what you see” तरीका, Apple Maps या Files जैसे visual layout वाले apps सहित सभी apps में इस्तेमाल किया जा सकता है
  • उदाहरण commands हैं “tap the guide about best restaurants”, “tap the purple folder”, जो screen पर दिख रही चीज़ को सीधे व्यक्त करते हैं
  • यह उन रुकावटों को कम करने में भी मदद कर सकता है जो तब आती हैं जब elements accessibility के लिए ठीक से label नहीं किए गए हों
  • Apple Intelligence आधारित Voice Control, U.S., Canada, UK और Australia के English environments में उपलब्ध होगा

Accessibility Reader और generated captions

  • Accessibility Reader dyslexia से लेकर low vision तक, विभिन्न disabilities वाले users के लिए customized reading experience देता है
  • Apple Intelligence लागू होने से यह science papers जैसी अधिक complex source material को भी संभाल सकता है
  • यह multiple columns, images और tables वाले text को भी process कर सकता है
  • on-demand summary users को details पढ़ने से पहले document overview देखने देता है
  • नई built-in translation, custom formatting, fonts और colors को बनाए रखते हुए users को अपनी native language में text पढ़ने देती है
  • नए generated captions, ऐसे वीडियो में speech audio transcription अपने-आप दिखाते हैं जिनमें captions या subtitles नहीं हैं
  • इसमें iPhone से रिकॉर्ड किए गए clips, friends और family से मिले videos, और online streaming videos शामिल हैं
  • captions, device पर speech recognition के ज़रिए निजी रूप से generate किए जाते हैं, और iPhone, iPad, Mac, Apple TV, Apple Vision Pro पर बिना subtitles वाले वीडियो में अपने-आप दिखते हैं
  • captions की appearance को video playback menu या Settings में customize किया जा सकता है
  • generated captions, U.S. और Canada के English environments में उपलब्ध होंगे

Apple Vision Pro में powered wheelchair control

  • कुछ powered wheelchair users joystick से drive नहीं कर सकते, इसलिए alternate driving control स्वतंत्र mobility के लिए ज़रूरी हो सकता है
  • Apple Vision Pro का सटीक eye tracking system, compatible alternate driving systems के लिए highly responsive input method के रूप में इस्तेमाल होता है
  • Vision Pro का eye tracking बार-बार recalibration की ज़रूरत के बिना, अलग-अलग lighting conditions में काम करता है
  • यह feature U.S. में Tolt और LUCI alternate driving systems के साथ लॉन्च किया जा रहा है
  • accessory support में Bluetooth और wired connection दोनों शामिल हैं, और wired connection के लिए Apple Vision Pro Developer Strap खरीदना ज़रूरी है
  • Apple, अधिक wheelchair driving systems को support देने के लिए developers के साथ काम जारी रखेगा
  • यह feature और Apple Vision Pro नियंत्रित environments में उपयोग के लिए बनाए गए हैं, और अधिक जानकारी support.apple.com/en-us/118507 पर उपलब्ध है
  • 10 साल से ALS के साथ जी रहे Pat Dolan ने कहा कि powered wheelchair को खुद नियंत्रित करने का विकल्प उनके लिए “सोने जैसा कीमती” है

Hikawa Grip & Stand for iPhone

  • Hikawa Grip & Stand for iPhone Apple Store online पर दुनिया भर में लॉन्च हो रहा है और तीन नए रंगों में उपलब्ध है
  • यह Los Angeles आधारित designer Bailey Hikawa द्वारा accessibility को ध्यान में रखकर बनाया गया MagSafe accessory है
  • development process में grip, strength और mobility को प्रभावित करने वाली विभिन्न disabilities वाले लोगों ने भाग लिया
  • यह एक adaptive grip और stand है, जो users को iPhone को अपने लिए सबसे उपयुक्त तरीके से पकड़ने में मदद करता है
  • Hikawa और PopSockets के सहयोग से यह adaptive accessory पहली बार वैश्विक स्तर पर उपलब्ध कराया जा रहा है
  • Apple The Grove in Los Angeles में Hikawa, Shane Burcaw और Alex Barone के साथ Today at Apple session आयोजित किया जाएगा
  • खरीद के लिए उपलब्ध देश हैं Australia, Austria, Belgium, Canada, China, Denmark, France, Hong Kong, Italy, Japan, the Netherlands, Singapore, South Korea, Spain, Sweden, Switzerland, Taiwan, the United Arab Emirates, the UK, the U.S., और इसे apple.com से खरीदा जा सकता है

अन्य accessibility updates

  • Vehicle Motion Cues को visionOS में जोड़ा गया है, जिससे moving vehicle में passenger के रूप में Apple Vision Pro इस्तेमाल करते समय motion sickness कम करने में मदद मिल सकती है
  • Vision Pro, tap और system actions करने के लिए face gestures को support करता है
  • Vision Pro में Dwell Control इस्तेमाल करते समय eyes से elements चुनने का नया तरीका भी जोड़ा गया है
  • Touch Accommodations iOS और iPadOS settings को personalize करने का नया तरीका प्रदान करता है
  • Made for iPhone hearing aids iOS, iPadOS, macOS और visionOS में Apple devices के बीच pairing और handoff को अधिक स्थिर बनाते हैं और setup experience भी बेहतर करते हैं
  • Larger Text support को tvOS में जोड़ा गया है, ताकि low vision viewers screen text size बढ़ाकर उसे आसानी से पढ़ सकें
  • Name Recognition hearing disability या hard of hearing users को तब alert कर सकता है जब कोई उनका नाम ले, और यह दुनिया भर की 50 से अधिक भाषाओं में काम करता है
  • sign language interpreter apps के लिए नया API, ongoing FaceTime video calls में users को human interpreter जोड़ने की सुविधा देता है
  • Sony Access controller को iOS, iPadOS और macOS में game controller के रूप में connect किया जा सकता है
  • Sony Access controller में thumbstick, 9 built-in buttons, और अधिकतम 4 अतिरिक्त external buttons या special switches को configure करके layout personalize किया जा सकता है
  • users दो controllers को मिलाकर और अधिक personalized gaming experience बना सकते हैं

उपलब्ध भाषाएँ और regional restrictions

  • Apple Intelligence beta के रूप में उपलब्ध है, और supported languages हैं English, Danish, Dutch, French, German, Italian, Norwegian, Portuguese, Spanish, Swedish, Turkish, Vietnamese, Chinese (simplified), Chinese (traditional), Japanese, Korean
  • कुछ features सभी regions या languages में उपलब्ध नहीं हो सकते
  • feature और language availability, तथा system requirements की जानकारी support.apple.com/en-us/121115 पर देखी जा सकती है

1 टिप्पणियां

 
GN⁺ 4 시간 전
Hacker News की राय
  • Apple को नई तकनीक को साधारण-सी जगह पर चुपचाप जोड़कर सार्वजनिक रूप से छिपे तौर पर टेस्ट करना पसंद है, इसलिए एजेंटिक AI को पहले accessibility feature के रूप में जारी करना Apple जैसा ही लगता है
    Touch Bar सिर्फ एक OLED पट्टी नहीं था, बल्कि Mac के Apple Silicon ट्रांज़िशन की पहली चाल था, और 2016 के Touch Bar MacBook का Apple T1 chip Mac में आया पहला पूरी तरह Apple-डिज़ाइन किया गया प्रोसेसर था
    इसने power management, fan, sleep/wake, camera और microphone access, और Touch ID के लिए Secure Enclave जैसी भूमिकाएँ Intel chipset से अपने हाथ में लीं, और बाद में T2 ने SSD encryption, audio management, camera image processing, और boot process tampering prevention तक संभाला
    iPhone 3G में Liquidmetal SIM eject tool था, जो एक custom metal alloy था जिसे हाथ से मोड़ना लगभग असंभव था, और Apple ने बाद में इस alloy का इस्तेमाल करने वाला कोई उत्पाद जारी नहीं किया, लेकिन लगभग 20 साल बाद foldable iPhone में liquid metal इस्तेमाल होने की अफ़वाह है
    RealityKit में भी Apple Vision Pro आने से पहले तक कई सालों से 3D scanning और कई AR features थे जिनका मतलब साफ़ नहीं था

    • यह कुछ ज़्यादा ही पढ़ लेना लगता है, और बस commercialization में असफल कोशिशें जैसी दिखती हैं
      Touch Bar लोगों को पसंद नहीं आया, और कई साल बाद जाकर tech enthusiasts ने उसे hack और tweak करके उसमें गहरी functionality जोड़ी तो कुछ लोगों को वह अच्छा लगा
      महँगे alloy से SIM eject tool बनाना भी बेकार बात थी, और RealityKit व Vision ऐसे लगते हैं जैसे solution समस्या ढूँढ रहा हो, जबकि Vision खुद भी डूबता हुआ दिख रहा है
      3D Touch में भी discoverability और usability की समस्या थी, और ऐसे उदाहरण और भी हैं
    • Apple का पहला खुद का modem भी सबसे सस्ती लाइन iPhone 16e से शुरू हुआ
    • “liquid metal” सुनने में अच्छा लगता है, लेकिन यह शायद metallic glass होने की ज़्यादा संभावना है
      ऐसी materials दशकों से मौजूद हैं, फिर भी Apple branding की वजह से यह लगभग उसी का पर्याय बनता दिखता है, जो मुझे काफ़ी खटकता है
      इसका कम इस्तेमाल होने की मुख्य वजह इसकी बहुत ऊँची कीमत है, लेकिन Apple जैसी कंपनी, जिसे करोड़ों parts की demand की गारंटी हो, उसके लिए economics मिलाना बहुत आसान होता है
    • सोच रहा हूँ कि क्या “LiquidMetal” एक अच्छे aluminum alloy से सच में बेहतर था
    • आने वाले Apple smart glasses वीडियो में लगभग हर उस स्थिति में बेहतर user experience दे सकते हैं जहाँ यूज़र को iPhone उठाना पड़ रहा था
      मैंने पढ़ा कि वीडियो या फ़ोटो लेते समय lens Meta की तुलना में ज़्यादा साफ़ तौर पर जलता या blink करता है, जो privacy concern में मदद कर सकता है, और कम से कम यह Meta नहीं है
      मुझे Meta smart glasses पसंद हैं, लेकिन मेरे दोनों pair खराब हो गए और support के लिए कोई store भी नहीं है, इसलिए Apple का product आते ही मैं जल्दी switch करने की सोचूँगा
  • developer नज़रिए से देखें तो Apple के OS-level accessibility API वाकई बहुत अच्छे हैं
    जो हिस्सा टूटता है, वह WebKit को native app के अंदर embed करने वाली boundary है
    मैंने एक Tauri app में Monaco editor को WKWebView के अंदर ship किया था, और बड़ी मुश्किल से पता चला कि VoiceOver का accessibilitySupport: auto mode चुपचाप Monaco में पीछे की ओर text selection तोड़ देता है
    इसे "off" पर सेट करना पड़ा ताकि selection ठीक से काम करे, और आखिर में normal text selection और VoiceOver support में से एक चुनना पड़ा, और जवाब selection था
    AppKit/UIKit में यह मज़बूत है, लेकिन आजकल ज़्यादातर desktop apps जहाँ सच में रहते हैं, उस embedded WebView boundary पर आकर टूट जाता है

  • मैं पहले एक sighted person के रूप में Be My Eyes में जुड़ा था
    उम्मीद जितनी calls नहीं आईं, लेकिन कुछ बार मदद कर सका, यह अच्छा लगा
    मैंने किसी के लिए डाक का लिफ़ाफ़ा पढ़ा, किसी के लिए दवा की बोतल पढ़ी, और एक बार दो मज़ेदार आदमी, जो बड़ी नरम कुर्सियों पर बैठे थे और shopping bag भर cereal boxes लाए थे, यह जानना चाहते थे कि कौन-सा box कौन-सा है
    याद है कि उनमें से एक आदमी को एक खास किस्म बहुत नापसंद थी
    इस app में एक अनोखी सुविधा थी जिसमें sighted person, visually impaired व्यक्ति के camera को remotely चालू कर सकता था
    https://www.bemyeyes.com

    • मेरे पास अभी भी Be My Eyes app install है, लेकिन एक साल से ज़्यादा समय से कोई call नहीं आया, और यह इस बात का सबूत लगता है कि AI vision models कितने शक्तिशाली हो गए हैं
      यह काफ़ी शानदार है कि AI इतना अच्छा काम करता है कि visually impaired लोग अपनी समस्याएँ खुद सुलझा सकें
      फिर भी, कभी-कभी किसी अजनबी की छोटी और random चीज़ में मदद करना बहुत मानवीय और अच्छा एहसास देता था
      मुझे अब भी वह बात अच्छी तरह याद है जब एक बुज़ुर्ग महिला से kitchen floor पर blueberries का एक डिब्बा गिर गया था और मैंने दिशा बताते हुए उसे सब ढूँढने में मदद की थी
      वह किसी अजनबी से जुड़कर कुछ दिलचस्प करने के 10 मिनट थे, और 4 साल बाद भी वह गर्मजोशी बनी हुई है
    • मेरी जानकारी में Be My Eyes ने AI features जोड़ने के बाद volunteers की ज़रूरत काफ़ी कम कर दी है
      मैं पूरी तरह blind हूँ, और AI जुड़ने के बाद ही इस app का इस्तेमाल शुरू किया; यह बच्चों के चीज़ें इधर-उधर करने के बाद food labels पढ़ने या TV चालू है या नहीं, यह देखने जैसे कामों में बहुत अच्छा है
      अगर मैं अभी भी अकेला रहता, तो शायद volunteer feature भी इस्तेमाल करता, लेकिन अब ऐसा नहीं है
    • मदद करना चाहने वाले लोग हमेशा मदद चाहने वालों से बहुत ज़्यादा थे
      यह अच्छी बात है, शिकायत नहीं, लेकिन मैंने कुछ साल पहले sign up किया था और मुझे एक भी call नहीं आई, इसलिए आखिरकार हटा दिया
    • सोच रहा हूँ किसने call किया था। क्या वे visually impaired लोग थे?
  • एक चीज़ जो Apple को सच में सही करनी चाहिए, वह है speech-to-text
    accessibility में इसने बहुत कुछ अच्छा किया है, लेकिन speech transcription में यह 10 साल नहीं तो कम से कम 5 साल पीछे लगता है
    आजकल iPhone पर input भयानक है
    palm rejection पहले से साफ़ तौर पर बदतर हो गई है, इसलिए typos ज़्यादा होते हैं, और typing autocorrect algorithm भी पहले से खराब हो गया है, अक्सर मैं जहाँ टाइप कर रहा हूँ उससे कुछ शब्द आगे के शब्दों को ग़लत बदल देता है
    speech recognition में भी सुधार नहीं हुआ, और phone form factor की वजह से उंगलियाँ भी थक जाती हैं
    काश iPhone इस्तेमाल करना यातना जैसा न रहे

    • Wispr Flow speech-to-text का benchmark है
      तुलना में Apple का solution पिछली सदी की चीज़ जैसा लगता है
      Apple का text-to-speech भी वैसा ही है, जब ElevenLabs और OpenAI बहुत आगे चल रहे हैं
      ज़रूरत बस इतनी है कि iPhone ऐसे काम उसी quality में native रूप से support करे, क्योंकि Apple के बंद ecosystem में तभी इसे हर जगह इस्तेमाल किया जा सकता है
    • जब तक Siri offline pre-downloaded maps के साथ “Navigate to ” को भरोसेमंद ढंग से संभाल नहीं सकती, तब तक मैं इससे कठिन speech-to-text या conversational features को पूरा मृगतृष्णा मानूँगा
      कल मैंने एक और भयानक iPhone input “feature” खोजा
      अगर आप किसी third-party CarPlay app में list browse कर रहे हों और उसे चुनने के लिए tap करने से ठीक पहले accelerator दबा दें, तो list कटकर कुछ items तक रह जाती है और ऊपर scroll हो जाती है
      गाड़ी चलाते समय distraction कम करने का क्या शानदार तरीका है। अगला क्या, कार चलने लगे तो map destination बदल जाएगा?
      काश human-computer interaction research का ज़्यादा व्यापक इस्तेमाल होता, और मेरा मानना है कि car/CarPlay ecosystem जैसी मूर्खताओं पर अदालत में जवाबदेही होनी चाहिए
      मैं पहले एक ऐसी कार चलाता था जो rear camera दिखाते समय हर बार उसे legal notice के पीछे छिपा देती थी, और मुझे यक़ीन है कि उस screen के रहते कम से कम एक pedestrian तो reversing कार से टकराया ही होगा
      ऐसे बुरे UI decisions के लिए manufacturers 100% ज़िम्मेदार होने चाहिए
    • iPhone keyboard ठीक करने में जिस चीज़ ने मेरी बहुत मदद की, वह थी Slide to Type बंद करना
      यह tip भी मैंने HN पर सीखी थी
      Settings app खोलें, General पर tap करें, फिर Keyboard तक नीचे जाएँ और Slide to Type बंद कर दें
    • हर दिन, पूरे दिन iPhone मुझे बेवकूफ़ जैसा महसूस कराता है
      मैं जो शब्द टाइप करता हूँ, या iPhone सोचता है कि मैंने जो शब्द टाइप किया है, उनमें लगभग हर दूसरे शब्द को सुधारना पड़ता है
      सुधारते समय भी autocorrect नए और और भी कम समझ आने वाले typos बना देता है
      कभी-कभी यह अचानक इतनी बुख़ारी सपने जैसी पागलपन की स्थिति तक पहुँच जाता है कि रोज़मर्रा का काम ठीक से नहीं हो पाता
      सबसे बुरी बात यह है कि पहले ऐसा नहीं था
      iPhone 4S पर मैं लगभग full-keyboard speed और accuracy से टाइप करता था
    • Colin Hughes ने कुछ साल पहले Voice Control की समस्याएँ समेटी थीं, तब से मुझे नहीं लगता कि इस दिशा में बहुत सुधार हुआ है
      https://www.theregister.com/on-prem/2023/08/16/those-who-rel...
      कम से कम दो बड़े bugs तो ठीक होने चाहिए
      supported जगहों पर भी input कभी-कभी random तरह से fail हो जाता है, और OneNote जैसे कई बड़े vendor apps dictation input को बिल्कुल support नहीं करते
      ऐसे मामलों में कम से कम दशकों पुराने Dragon Dictate जैसा fallback होना चाहिए
      capitalization अब भी random है, इसलिए सुधारने के लिए बहुत errors बाकी हैं
      Apple accessibility को असली feature से ज़्यादा showpiece press release बनाने वाली चीज़ की तरह देखता है
  • मज़ेदार बात: यह वीडियो sighted लोगों के लिए accessible बनाया गया है
    अगर कोई वास्तव में blind हो, तो वह उस speed की voice कभी नहीं सुनेगा, और जब आप visually impaired लोगों को computer इस्तेमाल करते देखते हैं, तो जिस speed पर वे audio सुनते हैं, वह कल्पना से परे होती है

    • https://youtu.be/wKISPePFrIs?si=ahGfFp0U7-pTU9w6&t=43
      मैं अक्सर Microsoft के blind software engineer Saqib Shaikh के Visual Studio पर इस talk का उदाहरण देता हूँ
      link उसी timestamp पर सेट है
    • बहुत पहले मैं एक community center में IT का काम करता था, और center director blind थे
      उनके screen reader के content पढ़ने की speed ने मुझे पूरी तरह चौंका दिया था, और मैं उसमें से कुछ भी समझ नहीं पाता था
      keyboard shortcuts पर उनकी पकड़ इतनी कुशल थी कि vim/emacs elite भी शर्मिंदा हो जाएँ
    • शायद यह इसलिए है क्योंकि यह ad है
      बहुत तेज़ robotic voice काफ़ी कठोर और चिढ़ाने वाली लग सकती है, और जो blind लोग उस पर निर्भर करते हैं, वे भी कभी-कभी overstimulation महसूस कर सकते हैं
    • सही। यह सिर्फ तेज़ नहीं, अक्सर बहुत robotic voice भी होती है, इसलिए sighted लोगों में से बहुत से लोग 1.5x speed पर भी समझ नहीं पाते
      मैंने blind लोगों के बारे में पढ़ा है जिन्होंने sound-based echolocation सीखी है, और वह सच में किसी superpower जैसी लगती है, इसलिए कभी न कभी monitor unplug करके tools को सही तरह इस्तेमाल करना सीखने का मन है
      कुछ साल पहले मेरे साथ काम करने वाले एक blind व्यक्ति ने screen हमेशा बंद रखी, इसलिए उसकी laptop battery बाकियों की तुलना में लगभग दोगुनी चलती थी, और सिर्फ उसी वजह से भी वह feature अच्छा था
      चाहे इतनी ज़बरदस्त echolocation तक न पहुँचा जाए, उसका आधा भी काफ़ी शानदार होगा, और accessibility changes को सच में QA कर पाने का bonus भी मिलेगा
    • 20 साल पहले मैं tier-1 tech support calls लेता था, और मुझे लगभग 3.2 सेकंड में समझ आ गया था कि caller visually impaired है, और उसी पल यह भी कि उसके screen reader की वजह से computer इस्तेमाल करने में उसे कोई रुकावट नहीं थी
  • यह LLM का सच में उपयोगी application लगता है
    काश और कंपनियाँ productivity के नाम पर लोगों को replace या squeeze करने की बजाय इस पर ध्यान दें कि लोगों की मदद कैसे की जाए

    • मेरा मानना है कि जब तक यह सच में उन लोगों के हाथों में नहीं पहुँचता जिन्हें इससे फ़ायदा होना है, तब तक फ़ैसला रोककर रखना चाहिए
      मेरा अनुभव बस मेरे बूढ़े माता-पिता तक सीमित है जिनकी नज़र कमज़ोर हो गई है, लेकिन Apple जितना font size allow करता है, उस पर phone पढ़ना ही असंभव हो जाता है
      चाहे first-party app हो या third-party app, हर app में text screen से बाहर बहने लगता है
      bill वाले example में यूज़र से provider से verify करने को कहा जाता है, लेकिन समझ नहीं आता कि bill पर दिए नंबर पर call ही क्यों नहीं कर देता
      text detection इस्तेमाल करने को कहने की बजाय खुद कर दे, क्यों नहीं? अगर यह Apple Intelligence है, तो उसमें वह क्षमता पहले से होनी चाहिए
      डर है कि कहीं यह बस धोखे का feature बनकर न रह जाए
      जोड़ दूँ, grip अच्छा दिखता है, और उम्मीद है Apple इस पर Apple tax नहीं लगाएगा
    • यही वह काम है जो Apple सबसे अच्छा करता है
      नई industry developments को product नहीं बल्कि technology की तरह ट्रीट करना
      AI खुद product नहीं होगा, बल्कि customer experience बेहतर करने वाला feature होगा
    • सहमत हूँ। बाहर से देखने वाले के रूप में भी इस क्षेत्र में काफ़ी संभावनाएँ दिखती हैं
      बस सच में आशा है कि पिछली पोस्ट की यह समस्या (https://news.ycombinator.com/item?id=48178378) इतनी आम न हो जाए कि ऐसे उपयोगी features ही जोखिम में पड़ जाएँ
      short term में इसकी संभावना कम लगती है, लेकिन use cases बढ़ेंगे तो malicious actors भी बढ़ेंगे
    • क्या यह server-based है? सोच रहा हूँ कि कोई अपनी जान iPhone पर भरोसे छोड़ रहा है, या data center पर
    • सच कहें तो, कंपनियाँ blind लोगों की मदद करके जितना पैसा कमा सकती हैं और software developers व financial analysts को replace करके जितना कमा सकती हैं, बस उसकी तुलना कर लें
      Apple अगर इस technology से ज़रूरतमंद लोगों की मदद करता है तो यह सराहनीय है
      लेकिन यह दिखावा करने की ज़रूरत नहीं कि ज़्यादातर कंपनियाँ इस दिशा में गहराई से क्यों नहीं जातीं
      ईमानदारी से कहें तो सबको कारण पता है, और ऐसे काम हमेशा धुँधले से “कोई और” के भरोसे छोड़ दिए जाते हैं
  • लगता है सबने इस हिस्से को छोड़ दिया, लेकिन motorized wheelchair के लिए eye tracking एक शानदार idea लगता है
    हो सकता है सिर्फ मुझे ऐसा लग रहा हो, और यह पहले से पुराना idea भी हो
    full VR ठीक से नहीं चला, लेकिन यह मुझे बार-बार सोचने पर मजबूर करता है कि क्या छोटे, हल्के और पतले devices के लिए कोई market है
    अगर यह सामान्य चश्मे के आकार में आ जाए, तो मुझे eye tracking device में दिलचस्पी हो सकती है
    अगर HUD system हो तो और भी ज़्यादा दिलचस्पी होगी, और बहुत basic level पर कुछ symbols दिखाना ही काफ़ी होगा
    basic audio हो तो और अच्छा, लेकिन HUD या audio से भी ज़्यादा ज़रूरी है सामान्य चश्मे जैसा form factor बनाए रखना

    • यह technology पहले से कुछ समय से मौजूद है
      जिन side links का हवाला दिया गया था, उन्हें follow करें तो https://www.tolt.tech जैसे examples मिलते हैं
      दिलचस्प बात यह है कि Apple ने इसे OS में integrate किया है
    • यह काफ़ी मज़बूत संकेत लगता है कि वे AR glasses पर काम जारी रखे हुए हैं
      ऐसा महसूस होता है कि यह उन features में से एक है जिन्हें Apple official hardware तैयार होने से पहले बाहर भेजकर polish करता है
  • bill की total amount due $83.89 है। भुगतान करने से पहले utility provider से verify करें या Text Detection का इस्तेमाल करके इस राशि की पुष्टि करें

    1. AI bill amount निकालता है
    2. जिन लोगों ने bill भेजा, उन्हें call करके पूछा जाता है कि कितना bill किया गया है
    3. billed amount चुकाई जाती है
    • तुरंत information मिल जाना और बाद में verify कर पाना भी फिर भी उपयोगी है
      किसी भरोसेमंद इंसान से numbers पढ़वा लेना कंपनी को call करने से बेहतर हो सकता है, लेकिन हर किसी के पास वह विकल्प नहीं होता
    • कुछ महीनों तक वही bill भरने के बाद आपको अंदाज़ा हो जाता है कि phone bill लगभग कितना आता है, इसलिए हर बार ऐसा करने की ज़रूरत नहीं होगी
      वह पंक्ति तो स्वाभाविक रूप से डालनी ही पड़ेगी, और यह वैसा ही है जैसे ChatGPT footer में लिखता है “हम जो भी बताएँ, उसे verify करें”
    • मुझे लगता है customer support को call करना disability वाले व्यक्ति के लिए भी उतना ही, या कम से कम लगभग उतना ही, झुंझलाहट भरा होगा जितना किसी और के लिए
    • अगर यह 60 दिनों तक bill याद रखे और पिछले bill के मुकाबले प्रतिशत बदलाव भी बता दे, तो यह उपयोगी हो सकता है
      जैसे, “इस bill की total amount due $83.89 है, और यह पिछले महीने उसी कंपनी के bill से 4% अधिक है”
  • अफ़सोस है कि Apple ने ad के YouTube version में screen-reader narration “the Apple logo” हटा दिया
    https://www.youtube.com/watch?v=B3SmsSCvoss
    मेरे हिसाब से वही हिस्सा ad को ख़ास बनाता था

    • audio language को "English descriptive" पर बदल दें
  • ईमानदारी से कहूँ तो, एक blind व्यक्ति और blind developer होने के नाते, इन features में से ज़्यादातर से ज़्यादा से ज़्यादा हल्की-सी उदासीनता ही होती है
    Seeing AI, Envision AI, BeMyEyes, Aira जैसे third-party apps पहले से ही इनमें से ज़्यादातर काम कर रहे हैं
    इसलिए सबसे अच्छा जो हो सकता है, वह यही कि Apple वही काम थोड़ा तेज़ और on-device करे, लेकिन इसका मतलब यह भी हो सकता है कि वह कम accurate हो, इसलिए देखना होगा
    इस बीच macOS का screen reader VoiceOver लगभग maintenance mode में छोड़ दिया गया है, और users को वे features जोड़ने के लिए काफ़ी प्रभावशाली third-party solutions खुद बनाने पड़े हैं जो Windows के समान screen readers में बहुत पहले से थे
    उस नज़रिए से यह सब थोड़ा performative लगता है, लेकिन फिर भी शायद मैं सुखद रूप से चौंक जाऊँ
    जिस चीज़ को लेकर मैं थोड़ा उत्साहित हूँ, वह Voice Control improvements हैं
    क्योंकि किसी button का programmed name guess करना या elements को target करने के लिए बार-बार number grid इस्तेमाल करना बिल्कुल मज़ेदार नहीं लगता
    voice speed की बात करें तो, उसे बहुत बढ़ाने के लिए काफ़ी अभ्यास चाहिए, और voice बदलने पर कुछ हद तक retraining भी करनी पड़ती है
    ज़्यादा “human-like” voices अक्सर बहुत ऊँची speed पर follow करना मुश्किल बना देती हैं, इसलिए बहुत से लोग ज़्यादा robotic लेकिन consistent voice पसंद करते हैं और अभी भी AI-based TTS पर पूरी तरह आश्वस्त नहीं हैं
    ऐसी voices बोलने की speed एक सीमा से ऊपर जाते ही अक्सर टूटने लगती हैं
    असली target users के judgment का इंतज़ार करने वाली बात सच में बहुत महत्वपूर्ण है
    ज़्यादा से ज़्यादा कंपनियाँ और व्यक्ति accessibility की बात करते हैं, accessibility solutions बनाते हैं, और accessibility के लिए AI का प्रचार करते हैं, लेकिन जिन लोगों की मदद का दावा करते हैं, उनसे कभी बात ही नहीं करते
    ऐसा करने पर गलती होना लगभग तय है, और बुरी स्थिति में मदद से ज़्यादा नुकसान हो सकता है
    accessibility को सही तरीके से करने के लिए, AI products सहित, आपको lived experience वाले लोगों को hire करना चाहिए
    नहीं तो नतीजा machine-translated text, one-click hacker-proof security, या AI coffee bar जैसी चीज़ें होती हैं जो हज़ारों rubber gloves order कर देती हैं
    संयोग से जोड़ दूँ, मेरे पास अभी नए project के लिए समय है :P

    • सहमत हूँ। अगर इस पोस्ट को पहली बार पढ़ने के बाद से एक घंटे में स्थिति नहीं बदली है, तो यह यहाँ किसी blind/low-vision व्यक्ति का पहला top-level comment है
      मेरे लिए, जो “खराब लेकिन सुधारी जा सकने वाली” नज़र से low vision की तरफ जा रहा हूँ, यह काफ़ी मूल्यवान था
      मुझे इन apps के बारे में पता ही नहीं था, और मैं ठीक ऐसी ही assistive technology ढूँढ रहा था
    • किसी ऐसे व्यक्ति से, जिससे मैं कभी मिला भी नहीं, वही निष्कर्ष सुनना जिस पर हम पहुँचे हैं, काफ़ी भरोसा देता है
      Apple ऐसे products बनाते हुए ऐसा लगता है जैसे उसने उस समस्या वाले लोगों से कभी बात ही नहीं की
      मज़े की बात यह है कि हम उन third-party apps में से जिनका आपने ज़िक्र किया, उनके competitor पर काम कर रहे हैं, और मेरे colleague के blind parent होने के कारण उसके पास बहुत अनुभव है
      एक MVP online है, लेकिन अभी बहुत खास नहीं है, और मैं “अरे, वही app तो मैंने बनाई है” वाला व्यक्ति नहीं बनना चाहता
    • यह अच्छा लगा कि affected perspective से राय सुनने को मिली
      लेकिन एक बात जिसने मुझे उलझाया, वह यह थी कि on-device processing के “धोखा” बन जाने की संभावना वाली बात
      भोलेपन में तो मैंने सोचा था कि इसका मतलब है कि यह phone service से स्वतंत्र होकर हमेशा काम करेगा, जो एक बड़ा फ़ायदा लगता है
      जैसे metro, plane, या दूर-दराज़ जगहों पर भी
      अलग से, मैं यह भी जानना चाहूँगा कि रोज़मर्रा की ज़िंदगी में सबसे बड़ा फ़र्क़ कौन-सा app लाता है