1 पॉइंट द्वारा GN⁺ 2026-02-02 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • iPhone 16 Pro Max में MLX LLM चलाने पर गलत संख्यात्मक आउटपुट मिलता है, जबकि वही कोड iPhone 15 Pro और MacBook Pro पर सामान्य रूप से काम करता है
  • Tensor वैल्यू में एक अंक से भी अधिक का अंतर दिखता है, और एक ही इनपुट पर भी परिणाम विकृत हो जाता है
  • समस्या का कारण Neural Engine या Metal-आधारित ML computation stack की हार्डवेयर खराबी माना जा रहा है
  • Apple Intelligence फीचर्स में भी डाउनलोड फेल होने जैसी मिलती-जुलती अस्थिरता दिखी, जिससे इनके जुड़े होने की संभावना उठी
  • डेवलपर ने इस मामले के ज़रिए इस बात पर ज़ोर दिया कि डिबगिंग के दौरान physical hardware problems को भी ध्यान में रखना चाहिए

MLX LLM चलाने में त्रुटि मिली

  • iPhone 16 Pro Max में MLX-आधारित LLM चलाने पर बेमतलब आउटपुट (gibberish) बन रहा था
    • वही कोड iPhone 15 Pro और MacBook Pro पर सामान्य रूप से काम कर रहा था
    • CPU उपयोग 100% तक पहुंच गया, और “stop” token नहीं बन रहा था, जिससे अनंत आउटपुट की स्थिति बनी रही
  • एक ही मॉडल और prompt इस्तेमाल करने के बावजूद tensor output values असामान्य रूप से बड़ी हो गईं
    • iPhone 15 Pro पर [53.875, 62.5625, -187.75, ...]
    • iPhone 16 Pro Max पर [191.5, 23.625, 173.75, ..., 1298, -147.25, -162.5]
    • इनपुट वैल्यू समान थी, लेकिन बीच के computation stages में संख्याएं तेज़ी से विकृत हो गईं

Apple Intelligence फीचर की समस्या

  • Apple Intelligence API का उपयोग करके खर्च वर्गीकरण फीचर लागू करने की कोशिश की गई, लेकिन model support डाउनलोड नहीं हुआ
    • सेटिंग्स कई बार बदलने पर भी फीचर सक्रिय नहीं हुआ
    • Apple community forum पर भी उसी समस्या का सामना करने वाले कई users (12 pages) की रिपोर्ट मिली
  • इसके कारण Apple Intelligence का उपयोग छोड़कर MLX-आधारित approach अपनाई गई

डिबगिंग प्रक्रिया और कारण की खोज

  • MLX के Gemma model implementation में breakpoint लगाकर हर layer के tensor values को ट्रैक किया गया
    • इनपुट वैल्यू दोनों डिवाइस पर समान थी, लेकिन iPhone 16 Pro Max में मध्य चरण से ही संख्याएं असामान्य रूप से बढ़ने लगीं
    • Mac पर भी iPhone 15 Pro जैसा ही सामान्य परिणाम मिला
  • इससे यह भरोसा हो गया कि समस्या कोड या मॉडल नहीं, बल्कि हार्डवेयर की है

हार्डवेयर खराबी की संभावना

  • iPhone 16 Pro Max के A18 chip Neural Engine या Metal-आधारित ML computation path में गणना त्रुटि होने की संभावना है
    • MLX, Metal के जरिए tensor computations compile करता है, इसलिए इस stack में खराबी परिणामों के विकृत होने का कारण बन सकती है
  • Apple Intelligence की समस्या का कारण भी यही हो सकता है, हालांकि इसके स्पष्ट प्रमाण नहीं हैं

निष्कर्ष और सीख

  • समस्या वाला iPhone 16 Pro Max हार्डवेयर खराबी वाला डिवाइस निकला
    • बाद में iPhone 17 Pro Max से बदलने पर सभी फीचर्स सामान्य रूप से काम करने लगे
  • डेवलपर ने इस अनुभव से यह ज़ोर देकर कहा कि डिबगिंग के समय software के साथ-साथ physical hardware problems को भी ध्यान में रखना चाहिए
  • तीन सीख:
    • LLM चलाने में त्रुटि हमेशा कोड की समस्या नहीं होती
    • समान environment में तुलना करके test करना महत्वपूर्ण है
    • महंगा हार्डवेयर भी ML computation accuracy की गारंटी नहीं दे सकता

1 टिप्पणियां

 
GN⁺ 2026-02-02
Hacker News की राय
  • मेथडोलॉजी जैसी भी हो, LLM से जोड़ करवाना बहुत अच्छा विचार नहीं है
    यह उतना ही मज़ेदार है जितना पूछना, “चाँद प्लस सूरज क्या होता है?”
    लेकिन इस बार मामला अलग है। Apple का numeric computation API कुछ डिवाइसों पर असंगत नतीजे दे रहा है। यह Apple के ध्यान देने लायक समस्या है
    • पूरी तरह अलग बात, लेकिन मेरे दिमाग में तुरंत “brightness” आया।
      क्योंकि सूरज(日) और चाँद(月) को मिलाने पर 明 बनता है (wiki link)
      “पूर्णिमा” जैसा जवाब भी हो सकता है, लेकिन शायद इसका कोई साफ़ deterministic जवाब नहीं है
    • “चाँद प्लस सूरज?” वह तो जाहिर है ग्रहण (eclipse) है
  • अच्छा होता अगर इसे किसी और iPhone 16 Pro Max पर भी टेस्ट किया जाता। तब पता चलता कि यह सिर्फ उसी डिवाइस की समस्या थी या नहीं
    • सही है। Apple Support आम तौर पर जैसा कहता है, उसके अनुसार OS को reset करके दोबारा install करना चाहिए था
      बैकअप तो ज़रूर लें, और हो सके तो iCloud+ प्लान के साथ करें। ऐसी समस्या में वही सबसे आसान समाधान होता है
    • पेज के नीचे दिए गए नवीनतम अपडेट के अनुसार, iPhone 17 Pro Max पर सब कुछ सामान्य रूप से काम कर रहा था
      यानी वह iPhone 16 Pro Max संभवतः hardware defect वाला था
  • low-level numeric optimization को अक्सर reproduce करना कठिन होता है
    उदाहरण के लिए Intel के दस्तावेज़ में भी इसका ज़िक्र है
    फिर भी iPhone 16 पर LLM का बिल्कुल काम न करना चौंकाने वाला है। LLM आम तौर पर quantization को काफ़ी हद तक सहन कर लेते हैं
    • “floating-point accumulation commutative नहीं होता” यह तो बुनियादी जानकारी है
      शुरुआत में मैं इसी वजह से इस समस्या को नज़रअंदाज़ करने वाला था,
      लेकिन बाकी सभी Apple डिवाइसों पर एक जैसे नतीजे आए, और Apple का अपना LLM सिर्फ इसी डिवाइस पर फेल हुआ — यह अजीब था
      यह किसी बुनियादी समस्या से ज़्यादा unexpected failure जैसा लगता है। Apple का ऐसी स्थिति वाला डिवाइस शिप करना अच्छा नहीं है
  • सच कहूँ तो यह लेख खोलते समय मुझे लगा था कि बात पुराने graphing calculators के स्मार्टफ़ोन से बेहतर होने की होगी
    मैं अभी भी अपने फ़ोन पर गणित के लिए HP Prime emulator इस्तेमाल करता हूँ
    • मुझे PCalc पसंद है। यह Mac Classic के ज़माने से हर Apple platform पर चलता आ रहा है (link)
      एक और पसंदीदा calculator है free42 या plus42 (link)
      CAS टूल के रूप में MathStudio सबसे बढ़िया है (mathstud.io)
      यह browser में भी चलता है, लेकिन इसका mobile app भी है। यह self-hosted Wolfram Alpha जैसा लगता है
    • मैं व्यक्तिगत रूप से iHP48 इस्तेमाल करता हूँ। यह मेरे कॉलेज के दिनों वाले HP 48GX पर metakernal इंस्टॉल किए हुए संस्करण पर आधारित है
      अब भी intuitive और तेज़ है
    • यह जानकर खुशी हुई कि iPhone की default calculator app हटाकर NumWorks लगाया जा सकता है
      मैंने इसे Control Center बटन से सीधे खोलने के लिए सेट कर रखा है
      शिकायत बस यह है कि स्क्रीन इतनी बड़ी होने के बावजूद पुराने calculation history को scroll करके नहीं देखा जा सकता
      1990s के 4-function calculator की नक़ल जैसी UI अब और नहीं देखनी
    • Android पर मैं TI 83+ emulator इस्तेमाल करता हूँ। जब असली calculator साथ नहीं होता, तब यह काम आता है
    • जब गंभीर गणना करनी होती है, तो आखिरकार मैं TI-84 physical calculator ही निकालता हूँ। हाथ का अभ्यास उसी में है
  • लेख दिलचस्प था, लेकिन अंत में दिया गया यह तर्क कि “MLX Neural Engine का उपयोग करता है” सही नहीं है
    MLX, CPU, Apple GPU(Metal), और NVIDIA GPU(CUDA) पर भी चल सकता है (link)
  • अगर bug को reproduce करने वाला code पोस्ट किया जाए, तो उससे सिर्फ Apple ही नहीं बल्कि दूसरे लोगों को भी मदद मिलेगी
  • तो क्या इसी वजह से मेरे iPhone का predictive text इतना खराब है?
    • अच्छा, तो सिर्फ मैं ही नहीं हूँ। पिछले लगभग 6 महीनों से टाइपिंग सचमुच भयानक रही है
      मैंने settings के हर तरह के combination बदलकर देखे, लेकिन predictive text random तरीके से रुक जाता है या गड़बड़ करता है
    • अब तो हालात इतने खराब हैं कि लगता है जैसे जानबूझकर ऐसा किया गया हो
      या शायद यह voice input की ओर धकेलने वाली optimization हो सकती है
  • लेख अच्छा था। बस काश इसमें इतना तो दिखाया गया होता कि गणितीय ऑपरेशन का परिणाम वास्तव में गलत था, इसके लिए कोई न्यूनतम test case दिया जाता
  • मैंने पूछा, “2+2 क्या है?” और iPhone ने “Applied.....*_dAK[...]” जैसा अजीब जवाब दे दिया
    फिर भी कम से कम उसने “7” तो नहीं कहा, यही गनीमत है
    • शायद Trurl और Klapaucius Q&A संभाल रहे थे
  • संभव है कि Neural Engine इस्तेमाल करने वाले दूसरे apps में भी ऐसे ही अजीब लक्षण दिखे हों
    अगर App Store के कुछ apps को टेस्ट किया जाता, तो शायद दिलचस्प नतीजे मिलते