1 पॉइंट द्वारा GN⁺ 2025-10-10 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Figure AI ने तीसरी पीढ़ी का humanoid robot Figure 03 पेश किया है, जो general-purpose काम कर सकता है और इंसानों से सीधे सीख सकता है; इसका लक्ष्य घरेलू उपयोग, commercial deployment और mass production है
  • इसमें खुद विकसित vision-language-action AI Helix के लिए डिज़ाइन किया गया next-generation sensor system और hand system शामिल है, जिससे frame rate 2x, latency 1/4, और field of view 60% बढ़ा है, तथा जटिल environments में precision manipulation और intelligent navigation संभव हुई है
  • घरेलू environments के लिए बेहतर safety features में multi-density foam, soft fabric cover, धोने योग्य और बदले जा सकने वाले कपड़े, wireless charging, UN38.3-certified battery, और बेहतर real-time voice conversation audio system शामिल हैं
  • mass production के लिए CNC machining से die-casting, injection molding और stamping जैसे mold processes पर शिफ्ट किया गया, जिससे parts count और manufacturing cost में बड़ी कमी आई; इसकी in-house manufacturing facility BotQ सालाना 12,000 units तक बना सकती है
  • fingertips पर 3 gram pressure तक महसूस कर सकने वाले high-precision tactile sensors और palm-embedded cameras की मदद से Helix अलग-अलग आकार और material वाली objects को स्थिर रूप से पकड़ सकता है; 10Gbps mmWave data offload के जरिए continuous learning संभव बनाकर सच्चे general-purpose robot की नींव रखी गई है

Figure 03

  • Figure 03 Figure का तीसरी पीढ़ी का humanoid robot है, जो Helix, घरों और global scale deployment के लिए डिज़ाइन किया गया platform है
  • इसका लक्ष्य इंसानों जैसे काम करना और लोगों से सीधे सीखना है — यानी एक सच्चा general-purpose robot
  • इसके लिए hardware और software को पूरी तरह से redesign किया गया है, और इसकी मुख्य विशेषताएं नीचे दी गई हैं
  • Helix: Figure 03 में Helix (Figure का vision-language-action AI) को support करने के लिए खास sensor system और hand architecture दिया गया है
  • घर: delicate materials, wireless charging, upgraded audio system और battery safety improvements जैसी additions से safety और usability में बड़ा सुधार हुआ है
  • mass production: इसे high-value mass production को ध्यान में रखकर डिज़ाइन किया गया है, जिसके लिए नई supply chain और manufacturing process बनाई गई हैं
  • global expansion: कम manufacturing cost और Helix से जुड़ी technology advances इसकी commercial viability को भी काफी बढ़ाती हैं

Helix के लिए डिज़ाइन

  • Figure का मानना है कि AI के बिना humanoid robots का scale-up संभव नहीं है, इसलिए Figure 03 को Helix AI के जरिए real-world reasoning हासिल करने के मुख्य लक्ष्य के साथ डिज़ाइन किया गया है
    • पूरी तरह redesign किया गया sensor system और hand system खास तौर पर Helix को चलाने के लिए बनाया गया है
  • next-generation vision system high-frequency visuomotor control को support करता है
    • नई camera architecture अधिक compact form factor में frame rate को 2x, latency को 1/4, और प्रति camera field of view को 60% तक बढ़ाती है
    • विस्तारित depth of field के साथ मिलकर यह Helix को ज्यादा dense और stable perception stream देता है
    • ये advances घर जैसे जटिल और भरे हुए spaces में intelligent navigation और precision manipulation के लिए जरूरी हैं
  • हर hand में wide field of view और low-latency sensing वाले palm-embedded cameras लगाए गए हैं
    • ये gripping के दौरान redundant और close-range visual feedback देते हैं
    • जब main cameras block हो जाते हैं, जैसे cabinet के अंदर काम करते समय या tight spaces में, तब भी Helix visual awareness बनाए रख सकता है, जिससे real-time adaptive control संभव होता है
  • Figure 03 का hand compliance और tactile design में बड़ा leap लाता है
    • ज्यादा soft और adaptive fingertips contact surface area बढ़ाते हैं, जिससे अलग-अलग shapes और sizes की objects पर ज्यादा stable grip मिलती है
    • मौजूदा market options की जांच में पाया गया कि current tactile sensors में real-world use सहन करने की मूलभूत सीमाएं हैं, इसलिए Figure ने अपना first-generation tactile sensor in-house develop किया
      • इसे extreme durability, long-term reliability और high-precision sensing के तीन सिद्धांतों पर डिज़ाइन किया गया
    • हर fingertip sensor 3 gram pressure जितना छोटा force भी detect कर सकता है — यानी उंगली पर रखी clip का वजन पहचानने जितना sensitive
      • इस precision के साथ Helix secure grip और slip के शुरुआती संकेत में फर्क कर सकता है, जिससे नाज़ुक, अनियमित या चलती हुई objects पर delicate control संभव होता है
  • इसमें 10 Gbps mmWave data offload capability भी है, जिससे पूरी fleet continuous learning और improvement के लिए terabytes data upload कर सकती है
    • ये advances Figure 03 को large-scale end-to-end pixel-to-action learning के लिए uniquely suited बनाते हैं

घरों के लिए डिज़ाइन

  • घर में प्रभावी ढंग से काम करने के लिए robot को रोज़मर्रा के environment में इंसानों के साथ सहजता से collaborate करना होगा
    • इसे ध्यान में रखते हुए Figure 03 में safety-focused design improvements की कई श्रेणियां जोड़ी गई हैं
  • रणनीतिक रूप से रखे गए multi-density foam pinch points को रोकते हैं, और hard machined parts की जगह इसे soft fabric से कवर किया गया है
    • Figure 02 की तुलना में इसका mass 9% कम है, और volume में भी बड़ी कमी आई है, जिससे घरेलू spaces में movement आसान होता है
  • Figure 03 की battery robot battery safety की सीमाओं को आगे बढ़ाती है
    • इसमें misuse या malfunction के खिलाफ multi-layer protection शामिल है (BMS, cell, interconnect और pack-level safeguards)
    • इसे UN38.3 standard certification पहले ही मिल चुका है
  • safety के अलावा Figure 03 को everyday usability के लिए भी डिज़ाइन किया गया है
    • soft fabric पूरी तरह washable है और tools के बिना हटाया या बदला जा सकता है, जिससे replacement तेज़ और आसान हो जाता है
    • इसे विभिन्न clothing options से customize किया जा सकता है, जिनमें cut-resistant और durable materials से बने garments भी शामिल हैं
  • robot के साथ स्वाभाविक रूप से संवाद करने के लिए Figure 03 में बेहतर real-time voice conversation के लिए upgraded audio hardware system है
    • Figure 02 के मुकाबले speaker size 2x है और output लगभग 4x बढ़ा है
    • microphones को बेहतर performance और clarity के लिए reposition किया गया है
  • पूरी तरह autonomous और wireless system की vision को आगे बढ़ाते हुए Figure 03 wireless inductive charging और wireless data offload को support करता है
    • robot के पैर में लगे charging coils की मदद से यह सिर्फ wireless stand पर खड़े होकर 2kW पर charge हो सकता है
    • घर के environment में robot दिनभर जरूरत के अनुसार अपने-आप dock होकर recharge कर सकता है

mass production के लिए डिज़ाइन

  • humanoid robots को पारंपरिक रूप से समय लेने वाले और महंगे engineering prototypes की तरह डिज़ाइन किया जाता रहा है
    • Figure 03 पहला robot है जिसे शुरुआत से ही mass production को लक्ष्य बनाकर डिज़ाइन किया गया है
  • यह तीन प्रमुख initiatives के जरिए हासिल किया गया
    • design और process का पुनर्निर्माण
    • पूरी तरह नई supply chain बनाना
    • high-capacity manufacturing facility BotQ का विकास
  • Figure 02 से Figure 03 में जाते समय Figure ने manufacturability और cost को ध्यान में रखकर robot के लगभग हर component को redesign किया
    • mechanical और electrical engineering teams ने parts count, assembly steps और ऐसे components को आक्रामक रूप से घटाया जो design requirements पूरी करने के लिए जरूरी नहीं थे
    • जहां Figure 02 मुख्य रूप से CNC machining के लिए डिज़ाइन किया गया था, वहीं Figure 03 die-casting, injection molding और stamping जैसे mold processes पर काफी निर्भर है
      • इस बदलाव के लिए tooling में शुरुआती बड़ा investment जरूरी था, लेकिन इसका फायदा स्पष्ट है
      • Figure 03 की हर unit की manufacturing cost में भारी कमी आई, और production volume बढ़ने पर economics बेहतर होती जाती है
  • Figure 03 को scale करने के लिए Figure को ऐसे industry के लिए पूरी तरह नई supply chain बनानी पड़ी जो अभी अस्तित्व में ही नहीं है
    • actuators, batteries, sensors, structures और electronics सहित कई critical modules में इसने vertical integration चुना है (ये सभी पूरी तरह in-house designed हैं)
    • individual components के लिए कंपनी ने ऐसे suppliers को रणनीतिक रूप से चुना और partner किया जो required volumes, timelines और team के सख्त quality standards पूरे कर सकें
    • एक साल की इस कोशिश का नतीजा Figure के साथ बढ़ने वाला global partner network है, जो आक्रामक ramp schedule के तहत हजारों से लेकर आगे चलकर लाखों parts तक produce कर सकता है
  • BotQ एक Figure-dedicated manufacturing facility है, जिसे robot production scale करने के लिए डिज़ाइन किया गया है
    • BotQ की first-generation manufacturing line शुरुआती तौर पर सालाना 12,000 humanoid robots तक बना सकती है
    • अगले 4 वर्षों में कुल 100,000 robots बनाने का लक्ष्य है
    • contract manufacturers पर निर्भर रहने के बजाय Figure ने quality, iteration और speed पर कड़ा control बनाए रखने के लिए सबसे महत्वपूर्ण systems का production in-house लिया है
    • इस facility में state-of-the-art systems और digital integration मौजूद हैं, और यह in-house developed Manufacturing Execution System(MES) पर आधारित है
      • सभी sub-assemblies और final assemblies इस line से full traceability के साथ गुजरते हैं, जिससे quality, repeatability और continuous improvement सुनिश्चित होता है

दुनिया के पैमाने के लिए डिज़ाइन

  • घरों के market पर Figure का focus commercial market के लिए Figure 03 की क्षमता को किसी भी तरह कम नहीं करता
    • घरों की variability और complexity को हल करके Figure एक सच्चा general-purpose product बना रहा है, जो workforce में संभवतः सबसे व्यापक range के tasks कर सके
  • Figure 03 कई कारणों से commercial applications के लिए उपयुक्त है
    • इसके actuators बेहतर torque density (nm/kg) के साथ 2x तेज़ गति से काम कर सकते हैं
    • इसका सबसे महत्वपूर्ण परिणाम है तेज़ गति से items को pick-and-place करने की क्षमता
  • Helix के लिए बनाए गए hand और sensor system के improvements का commercial use cases में बड़ा महत्व है
    • camera और perception system upgrades की मदद से Figure 03 commercial environments में intelligent navigation और precision manipulation कर सकता है
    • ऊपर बताए गए hand changes (compliance, fingertip surface area, tactile sensing) छोटे sheet metal parts और deformable polybags जैसी विभिन्न objects पर बेहतर stable grip देते हैं
  • inductive charging की वजह से Figure 03 कुछ use cases में समय-समय पर charging mat पर खड़े होकर लगभग continuous operation दे सकता है
    • fast wireless data offload की मदद से robot shifts के बीच break के दौरान dock पर लौटकर आसानी से offload कर सकता है
  • commercial customers Figure 03 fleet के लिए अपने unique uniforms डिज़ाइन कर सकते हैं
    • इसमें ज्यादा durable या cut-resistant materials के options और specific environments के लिए अन्य design changes शामिल हो सकते हैं
    • Figure 03 की नई side screens बड़े fleets में quick identification की सुविधा देती हैं, और इन्हें हर customer की branding या operational requirements के हिसाब से पूरी तरह customize किया जा सकता है

निष्कर्ष

  • Figure 03 humanoid robots को experimental prototypes से deployable और scalable product में बदलने की दिशा में अभूतपूर्व प्रगति है
    • advanced perception और tactile intelligence को home safety design और mass-production readiness के साथ जोड़कर Figure ने ऐसा platform बनाया है जो घर और commercial environments दोनों में सीख सकता है, adapt कर सकता है और काम कर सकता है
  • Helix, घरों और global scale के लिए डिज़ाइन किया गया Figure 03 सच्चे general-purpose robot की नींव स्थापित करता है — ऐसा robot जो लोगों के रहने और काम करने के तरीके को बदल सकता है

1 टिप्पणियां

 
GN⁺ 2025-10-10
Hacker News की राय
  • यह बताया गया कि वीडियो के सभी उदाहरण चुने हुए शॉट्स हैं। अगर आप वास्तव में humanoid robots पर काम करने वाले लोगों से पूछें, तो दोहराए गए execution में failure rate ऊँचा होता है और success path बहुत संकरा होता है। अगर कई कंपनियों के robots को बुलाकर उनकी capabilities पहले से verify की जाएँ, फिर training data में न रहे environment में benchmark किया जाए, तभी असली failure rate दिखेगा। अभी यह बस tech demo चरण है। ज़्यादातर training physics को approximate करने वाले simulation में होती है और बाकी काम इंसान joystick से सीधे control करते हैं। हाथ से किए जाने वाले लगभग सभी actions इसी श्रेणी में आते हैं, और failure rate काफ़ी है。

    • आख़िरी वीडियो में दिखाया गया काम—‘पैकेज के ढेर में से डिब्बा उठाकर label नीचे की ओर रखते हुए conveyor पर रखना’—सबसे ज़्यादा वास्तविक लगता है। मैंने Twitter पर पिछले मॉडल का इसका 1 घंटे का बिना कट वाला वीडियो देखा था (लिंक)। Humanoid robot ज़रूरी न भी हो, लेकिन अलग-अलग packages को उठाकर manipulate करना और failure के बाद recover करना काफ़ी प्रभावशाली है।

    • यही असली मुद्दा है। अगर यह robot यह कर सकता है, तो store shelf restocking जैसे साफ़ उपयोग सामने आते हैं। Picking और placing जैसे काम सीमित conditions वाले होते हैं, उनमें human जैसी mobility चाहिए, और humanoid form ऐसे environment के लिए उपयुक्त है। सवाल यह है कि हम वहाँ तक कितने पास पहुँच चुके हैं। यह 2020 में भी कोशिश की गई थी (लिंक), और 2022 में भी (लिंक)। 7-11 Japan में इस्तेमाल होने वाला tracked robot है। Store में घूमकर shelves को visually inspect करने और planogram से compare करने वाले robots पहले से काफ़ी व्यापक हैं। वे सामान को सीधे handle नहीं करते। Inventory work planning में मदद करने वाले systems भी मौजूद हैं। Delft University of Technology की research team का दावा है कि 5 साल के भीतर यह संभव होगा (लिंक), हालाँकि source का सही timing स्पष्ट नहीं है।

    • जिस बात को मैं कहना चाहता था, उसे इसने बहुत अच्छे से समेट दिया। सच में, ये सारे वीडियो marketing के लिए हैं। Logistics वीडियो देखते हुए (लिंक) मैं इस मॉडल को घर के काम करते हुए देखना चाहता हूँ। यह बिल्कुल smooth नहीं होगा, और इसमें बहुत mistakes और failures होंगे। मेरा मतलब नकारात्मक नहीं है; बस इच्छा यह है कि वही सब जैसा है वैसा दिखाया जाए। अगर अगला वीडियो आता है तो मैं ज़रूर देखना चाहूँगा।

    • हमेशा से यही होता आया है। कंपनी बने हुए अभी कुछ ही साल हुए हैं। मैं humanoid camp का अंधभक्त नहीं हूँ, लेकिन कुछ शुरू करना हो तो कहीं न कहीं से शुरू करना ही पड़ता है। दुर्भाग्य से funding पाने के लिए हमेशा ‘hype > truth’ वाला ढाँचा बन जाता है, इसलिए ऐसे carefully selected videos सामने आते हैं।

    • मैंने Amazon package sorting का 1 घंटे तक लगातार चलने वाला वीडियो देखा है (लिंक)। समझ नहीं आता कि ऊपर की बातों को उस वास्तविक footage के साथ कैसे reconcile किया जाए।

  • यहाँ के comments बहुत ज़्यादा नकारात्मक लग रहे हैं। 5 साल पहले तक यह सब बिल्कुल असंभव था। अब consumer robots के demos सामने आने लगे हैं जो कुछ ही iterations के बाद घर के ज़्यादातर काम बिना समस्या कर पाने के क़रीब दिखते हैं। जैसे मेंढक का पानी अचानक तेज़ी से उबलने लगे, वैसा तेज़ बदलाव आ रहा है।

    • आपने कहा 5 साल पहले यह असंभव था, लेकिन Boston Dynamics 20 साल से actual product demos दिखा रहा है, और वे hype videos नहीं थे। फिर भी उनमें से एक भी बड़े बाज़ार में वास्तविक उपयोग के मामले तक नहीं पहुँचा। उम्मीद रखी जा सकती है, लेकिन यह भी समझा जा सकता है कि लोग इतने सावधान क्यों हैं।

    • लक्ष्य हासिल होने से पहले यह किसी को नहीं पता होता कि वह कब मिलेगा। Smartphone की तरह अचानक फैलने वाले उदाहरण भी हैं, लेकिन fusion की तरह ऐसे क्षेत्र भी हैं जहाँ दशकों तक breakthrough नहीं आता। Humanoid robots दूसरे वाले उदाहरण के ज़्यादा क़रीब हैं, इसलिए लोग हर नए advance पर तुरंत उत्साहित नहीं होते। बाद में अगर breakthrough आ गया तो सब कहेंगे कि वही ‘असल’ था, लेकिन उससे पहले हर किसी को संदेह रहता है।

    • आपने कहा कि ‘कुछ iterations के बाद यह घर के ज़्यादातर काम बिना समस्या करने लगेगा’, लेकिन मुझे तो लगता है कि उससे पहले वे plumber वाली नौकरियाँ भी चली जाएँगी, जो हमें white-collar jobs को LLM से replace होने पर करने को कहा जाता है।

    • Repeatable demos और तेज़ evolution की बात होती रहती है, लेकिन वे अब भी महँगे हैं या फिर real environment में खुद सीखकर काम नहीं कर पाते। यह शायद Nवीं shirt-folding robot video है जो मैं देख रहा हूँ, लेकिन मैंने अब तक इसे बिखरे हुए कमरे या कपड़ों के ढेर में से चीज़ें निकालते नहीं देखा। मैंने सोचा था पहला AI robot एक pet होगा, लेकिन अभी तो यह Furby के स्तर तक भी नहीं पहुँचा लगता।

  • अगर ये robots घर के सारे काम कर भी दें, तब भी मुझे इस बात की चिंता है कि मेरी privacy manufacturer के सामने खुल जाएगी। Ring camera के security breach वाले मामले देखें (लिंक), तो समझ आता है कि चलने-फिरने वाले robot के साथ privacy violation का स्तर कहीं ज़्यादा गंभीर होगा। अगर मैं इसे खरीदूँगा, तो मुझे मज़बूत privacy guarantees चाहिए होंगी।

    • Camera वाले Roomba model में शर्मनाक images manufacturer तक भेजी गई थीं और कर्मचारियों ने वह footage social media पर share भी की थी। यानी ऐसा पहले ही हो चुका है। घर में घूमने वाले camera drone security systems भी थे, पता नहीं उनका क्या हुआ। मुझे चिंता थी कि इस तरह की privacy leaks की और भी घटनाएँ सामने आएँगी (लिंक)।

    • Figure 03 के बारे में कहा गया है कि उसमें 10Gbps mmWave data offloading है, जिससे पूरा fleet continuous learning के लिए terabytes data upload कर सकता है। यह पढ़ते ही मेरा जवाब सीधा ‘नहीं’ है।

    • Privacy अपनी जगह, लेकिन मैं यह सोचकर भी घबरा जाता हूँ कि अगर @elder_plinius जैसा कोई शख़्स घर आ जाए तो क्या-क्या हो सकता है। AI safety का मुद्दा AI को शरीर मिलते ही बहुत ज़्यादा वास्तविक बन जाता है।

    • मुझे सबसे ज़्यादा डर इस बात से लगता है कि कहीं robot remotely hack न हो जाए और मेरे सोते समय मुझे नुकसान न पहुँचा दे।

    • मेरी इच्छा है कि इसे ऐसे program किया जाए कि परिवार का कोई सदस्य कमरे में आए तो robot तुरंत बाहर चला जाए, और सिर्फ़ हमेशा खाली रहने वाले कमरों में ही सफ़ाई करे।

  • लोग बहुत ज़्यादा आलोचनात्मक हैं। यह भी याद रखना चाहिए कि अभी इन robots की हालत अपनी सबसे ख़राब अवस्था में है। अगर एक robot किसी एक काम में improve करता है, तो पूरा समूह वह learning share कर सकता है। आगे यह लगातार बेहतर ही होगा।

    • वीडियो manipulated या carefully selected होने का पता होते हुए भी, यह प्रगति डरावनी हद तक प्रभावशाली है। लोग इसे इतना नकारात्मक रूप से देख रहे हैं, यह बात ही मुझे हैरान करती है।

    • मुझे technological progress पर संदेह नहीं है, लेकिन निजी तौर पर मुझे लगता है कि tech advancement बहुत जल्दी dystopian दिशा में मुड़ गया है, इसलिए अब उसमें सकारात्मक रहना मुश्किल है। शायद इसी वजह से इतने नकारात्मक reactions आते हैं। हाँ, कुछ लोग investment bubble को लेकर भी चिंतित हो सकते हैं।

  • समझ नहीं आता कि charging की ज़रूरत ही क्यों हो। 1/3 capacity की 3 batteries डाल दी जाएँ और हर एक को independently charge किया जा सके, तो robot charging station पर जाकर बस battery swap कर सकता है। फिर wireless charging या cable की क्या ज़रूरत है? Battery swapping कहीं ज़्यादा logical लगती है। अगर battery life data के आधार पर robot खुद replacement और recycling भी कर सके तो और अच्छा हो। अगर charging station बाहर solar panels के नीचे हो, तो बिजली का बिल भी बच सकता है। Charging या battery replacement के समय वह दरवाज़ा भी खुद lock कर सकता है, और मौसम ख़राब हो तो पूरी setup को अंदर भी ला सकता है।

    • यह battery life पर निर्भर करता है। अगर वह पूरे दिन चल सकता है, तो रात में pad पर खड़ा करके charge करना ही तर्कसंगत है। Removable batteries जोड़ने से वजन बढ़ेगा और battery placement की flexibility घटेगी। Charging speed भी अहम है; अगर 30 मिनट में 80% charge हो जाए, तो मुख्य कामों के बीच छोटे-छोटे charging breaks लिए जा सकते हैं। अगर पैरों के नीचे inductive charging संभव हो, तो उसे बड़े charging mat पर खड़ा रखकर factory environment जैसी जगहों पर लगभग unlimited uptime पाया जा सकता है। अगर कपड़े fold करने या बर्तन धोने में 30 मिनट लगते हैं, तो वहीं charging mat बिछाकर काम करते-करते charge कराया जा सकता है। हो सकता है भविष्य के नए घरों में हर फ़र्श के नीचे charging coils built-in हों।

    • Battery swap के लिए अतिरिक्त moving parts और dedicated housing चाहिए, batteries भी ज़्यादा robust होनी चाहिएँ और कम-से-कम 2 batteries लगेंगी। Cable connection ऐसा लगता है कि robot खुद plug कर सकता है, लेकिन वास्तविकता में environment unpredictable होता है, इसलिए तार बाधा बन सकते हैं। (हालाँकि inductive chargers भी बाधित हो सकते हैं...)

    • सबसे संभावित वजह यही लगती है कि pre-programmed scenario में भी तय जगह पर battery swap करना अभी कठिन है। खुद charging cable लगाना भी संभव नहीं है। फिर भी laundry fold करने की बात करके वास्तविक क्षमता को बढ़ा-चढ़ाकर पेश किया जा रहा है। अगर ऐसा कोई announcement आए, तो मैं तुरंत stock बेच दूँगा।

    • यह भी सोचना चाहिए कि अगर वह battery swap न कर पाए और charging station तक न पहुँच पाए तो क्या होगा। जैसे robot vacuum सोफ़े के नीचे फँस जाता है, वैसे ही आपको 150cm/300kg की मशीन को खींचकर निकालना पड़ सकता है।

    • Demo में Walker S2 battery swap अच्छी तरह संभालता हुआ लगता है (लिंक)।

  • इसे GPT-2 से compare करने वाली राय मुझे दिलचस्प लगी। ऊपर से यह शानदार analogy है, लेकिन असल में दोनों बिल्कुल अलग हैं। GPT के लिए training data—web documents, books वगैरह—पहले से मौजूद था। Compute resources भी पहले से थे। अंततः यह 2017 के paper के idea को मौजूद संसाधनों को जोड़कर वास्तविक बनाने वाली ‘combination game’ थी, और एक बार कोशिश की तो वह काम कर गई। दूसरी ओर, humanoid robots के लिए neural network training में लगने वाला real-world data scale के हिसाब से लगभग मौजूद ही नहीं है, और data की प्रकृति भी token prediction जितनी सरल नहीं बल्कि कहीं ज़्यादा जटिल है। फिर भी Figure team के challenge-taking attitude की सराहना करता हूँ। Selected examples स्पष्ट हैं, लेकिन यह product sales के लिए नहीं बल्कि investors को R&D और research दिखाने के लिए है, इसलिए अंततः मुझे लगता है कि innovation के लिए इसका सकारात्मक पक्ष है।

    • Simulated environment में RL चलाने और visual LLM को verification के लिए इस्तेमाल करने वाली संरचना—2D image से state check करना, Vision-Language Model का 0 या 1 लौटाना—का ज़िक्र किया गया, और Sora जैसे video extension model को washing machine से dryer तक के कामों में FPV(First Person View) आधारित prediction structure के रूप में लागू करने का idea सुझाया गया।

    • यह सीधे विषय से जुड़ा नहीं है, लेकिन संदर्भ के लिए उपयोगी कुछ संबंधित research materials के links साझा किए गए हैं
      लिंक1
      लिंक2
      लिंक3
      लिंक4

    • क्या यह मान लेना नहीं है कि मौजूदा training methods ऐसे ही चलते रहेंगे? लगता है environment से सीधे सीखने के तरीक़े चाहिए होंगे। हाल की research में ऐसे general intelligence structures के लिए architecture भी प्रस्तावित हुए हैं। लेकिन इस दिशा में अभी बड़े निवेश या गंभीर प्रयास के पर्याप्त उदाहरण मैंने नहीं देखे।

  • वीडियो में दिखाए गए use cases दिलचस्प हैं। दुनिया इंसानों को ध्यान में रखकर डिज़ाइन की गई है, इसलिए human-shaped robot उपयुक्त लगते हैं। इसमें यह फ़ायदा है कि washing machine या पूरे घर को robot के हिसाब से बदलने की ज़रूरत नहीं पड़ती। लेकिन hotel front desk जैसी नौकरियों में, जहाँ मानवीय तत्व ज़रूरी है, robot लगाना बेमानी है। अगर इंसान से मिलने वाले लाभ—मूड, अपनापन—सब हटा दिए जाएँ, तो फिर kiosk कहीं बेहतर और व्यावहारिक है।

    • मैंने सोचा है कि हमें human-friendliness और efficiency में किसे प्राथमिकता देनी चाहिए। कई मामलों में हमने efficiency को चुना है। जब robots तरह-तरह के काम पूरी तरह करने लगेंगे, तब इंसान-प्राथमिक spaces बनाए रखने की वजह कम हो जाएगी और humanoid form के फ़ायदे भी घट जाएँगे। जैसे logistics warehouses अभी भी इंसानों की वजह से human-centered हैं; पूरी automation होने पर यह मानक भी गायब हो सकता है।

    • कुछ साल पहले Las Vegas की एक business trip में hotel check-in/check-out का automation काफ़ी प्रभावशाली लगा। Kiosk पर सिर्फ़ code और passport दिखाकर options चुनना, room location की जानकारी/printout लेना, keycard जारी होना—सब तेज़ी से हो गया। अनुभव के हिसाब से 4 kiosks मिलकर 4 कर्मचारियों के 90% से ज़्यादा काम संभाल सकते थे, और waiting का अनुभव भी अलग था। हालाँकि kiosks भी बहुत fail होते हैं; airport पर तरह-तरह की दिक्कतें दिखती हैं। और washing machine वाली बात पर, home automation में standardization आगे बढ़ाना बेहतर समाधान है। Thread जैसी technology से ‘housebot’ को state खुद check करने की जगह real-time information मिलनी चाहिए।

    • मैं लंबे समय से hotel और rental car check-in को automate करने की बात करता आया हूँ। हाल ही में rental car में ऐसा system इस्तेमाल किया, लेकिन अनुभव smooth नहीं था। System code पहचानने में विफल रहा, कई बार staff की मदद लेनी पड़ी, और key assignment में भी गलती हुई। आख़िर में किसी कर्मचारी को फिर से key डालनी पड़ी, तब जाकर बात बनी। Idea अच्छा है, लेकिन execution कमज़ोर था।

    • विडंबना यह है कि चलने वाला robot शायद ‘खुद चल सकने वाले computer’ के रूप में सबसे वास्तविक उपयोग पा सकता है। अगर उसे mobile server, speaker, या data instrumentation के लिए legs की तरह इस्तेमाल किया जाए, ताकि वह field situation में खुद को deploy कर सके, तो वह दिमाग़ के 15% को झंझट वाले कामों से मुक्त करके बहुत उपयोगी हो सकता है। (Hotel keycard वाली बात पर लौटें तो, तकनीकी रूप से keycard reader credit card reader की भूमिका भी निभा सकता था, लेकिन व्यवहार में staff मेहमान की safety status को अपनी आँखों से verify भी करते हैं, इसलिए simple automation मुश्किल है।)

    • कुछ लोग front desk का मानवीय interaction पसंद नहीं करते। अगर विकल्प मिले तो वे सिर्फ़ QR code या pass लेकर बिना किसी human contact के सीधे कमरे में जाने के लिए अतिरिक्त पैसे देने को भी तैयार होंगे।

  • लगता है engineers यह नहीं समझते कि लोग low-level high-efficiency tools की तुलना में inefficient लेकिन higher-level tools, जैसे humanoids, को क्यों पसंद करते हैं। उदाहरण के लिए dishwasher लाने में ख़रीदना, install करना, manual समझना जैसी झंझटें हैं; जबकि किसी इंसान से ‘plates धो दो’ कहना कहीं ज़्यादा सहज है। नतीजा थोड़ा कमतर भी हो तो बहुत-से users इसके लिए अतिरिक्त पैसे देने को तैयार रहते हैं। Efficiency के लिए समय और मेहनत न लगाना भी मानव स्वभाव का हिस्सा है।

    • असली इंसान को hire करने में भी यही बात लागू होती है। प्रति घंटा लागत ज़्यादा हो और performance कमतर हो, तब भी employee management की कई जटिलताओं से बचा जा सकता है। (मैं यह नहीं कह रहा कि यह अच्छा विचार है; बस purely cost angle से देख रहा हूँ।)

    • लेकिन इसकी सीमाएँ भी साफ़ हैं। जैसे बर्तन धोने के लिए आज भी पैसे देकर सर्वोच्च efficiency और flexibility वाली घरेलू मदद ली जा सकती है। अगर कई घरेलू काम करने वाला automaton जैसा नौकर मौजूद हो, तो लोग उसके लिए $1k से $100k तक वास्तव में कितना भुगतान करने को तैयार होंगे, और maintenance cost, reliability जैसी कितनी variables होंगी—यह सब बड़ा सवाल है। भीतर-ही-भीतर मुझे जिज्ञासा है कि ‘बहुत से लोग इसे पसंद करेंगे’ वाली श्रेणी वास्तव में कितनी बड़ी होगी।

  • Robot का design मुश्किल है, लेकिन असली मुश्किल ‘deployment’ है। कितनी units कहाँ, किस काम में लगाई गईं—यही असली सवाल है। कौन-से tasks वास्तव में पर्याप्त उपयोगी हैं, हर environment के अनुसार robot कैसे adapt करता है, समय के साथ कैसा बदलता है—यह सब देखना होगा। General-purpose robot development में सबसे बड़ी बाधा हमेशा AI ही रही है। अगर Figure सचमुच उन्नत और बहुमुखी AI बना लेता है, यानी वह तुरंत कई तरह के environments में deploy होकर अलग-अलग tasks में सीधे परिणाम देने लगे, तो वह एक blockbuster product होगा। अगर वास्तविक deployments को track करके दिखे कि छोटे व्यवसायों, जटिल जगहों—जैसे construction और maintenance—में इसका उपयोग हो रहा है, और यह Walmart truck unloading से लेकर store shelf restocking तक सहजता से कर रहा है, तब वह सचमुच बड़ी बात होगी।

    • वास्तविकता में, शुरुआती realistic deployment उस 7 मिनट के sleek trailer जैसी चीज़ नहीं बल्कि party champagne butler या hotel reception robot जैसे अमीरों के novelty toy role में होने की संभावना ज़्यादा है। Walmart स्तर की गंभीर mass deployment शायद कुछ और generations बाद ही संभव होगी।
  • अगर ऐसे robots 30 लाख रुपये के दायरे में आने लगें, तो मुझे लगता है कि हर घर में इनके आने का दौर शुरू हो सकता है। Fusion के साथ-साथ home robot हमारी पीढ़ी की प्रतीकात्मक technologies में से एक बन सकते हैं। हमने इसे लंबे समय तक सिर्फ़ कल्पना में देखा, लेकिन अब लगता है कि मेरी ज़िंदगी में ही यह आर्थिक रूप से व्यावहारिक हो सकता है। घर में robot होने का विचार आधा डर, आधा विस्मय, आधी बेचैनी जैसा है।

    • Privacy issue का समाधान अनिवार्य है। सिद्धांततः robot को सिर्फ़ मेरे घर के basement में लगे server से ही communicate करना चाहिए।

    • मैं यह भी उम्मीद करता हूँ कि ऐसे robots के hack होकर जघन्य अपराधों में दुरुपयोग होने की ख़बरें भी कभी सामने आएँगी।

    • घरेलू कामों का आर्थिक मूल्य बहुत ज़्यादा नहीं होता, इसलिए जब तक यह बहुत सस्ता न हो, तब तक इसका mass adoption मुश्किल है। मैं बर्तन धोने या washing machine चलाने के लिए 30 लाख रुपये खर्च नहीं करूँगा। Tech-savvy अमीर लोग novelty की वजह से खरीद सकते हैं, लेकिन आम लोग value for money ही देखेंगे। पहले Roborock जैसे robot vacuums सस्ते थे, इसलिए तेज़ी से बिके, लेकिन अब वे कई घरों में बस पड़े रहते हैं। Robots का सबसे मज़बूत उपयोग industry, manufacturing, construction और agriculture में है। वहाँ भी humanoid shape ज़रूरी नहीं है; बल्कि ऐसा रूप labor unions की प्रतिक्रिया और बढ़ा सकता है। हो सकता है ‘सिर्फ़ एक tool’ जैसा दिखने वाला robot ज़्यादा स्वीकार्य हो।

    • मैं smart home trend भी पूरी तरह छोड़ चुका हूँ, इसलिए यह trend भी छोड़ दूँगा। मैं बस हमेशा की तरह अपने बर्तन खुद धोता रहूँगा और कपड़े खुद धोता रहूँगा।