1 पॉइंट द्वारा GN⁺ 2024-11-01 | 1 टिप्पणियां | WhatsApp पर शेयर करें

Physical Intelligence (π) π0: हमारी पहली सामान्य-उद्देश्य नीति

  • हम AI नवाचार के युग में जी रहे हैं, और AI शतरंज खेलने या नई दवाओं की खोज जैसी समस्याएँ हल कर सकता है, लेकिन शर्ट मोड़ने या टेबल साफ़ करने जैसे भौतिक दुनिया के कामों में अभी भी मानव बुद्धिमत्ता से पीछे है.
  • π0 एक सामान्य-उद्देश्य रोबोट foundation model है, जिसे इस लक्ष्य के साथ विकसित किया गया है कि उपयोगकर्ता रोबोट से अपनी इच्छित कार्यों का अनुरोध कर सकें.
  • π0 इमेज, टेक्स्ट और एक्शन को समेटता है, और रोबोट के अनुभव के माध्यम से भौतिक बुद्धिमत्ता हासिल करता है.

सामान्य-उद्देश्य रोबोट नीति का वादा

  • वर्तमान रोबोट खास कामों के लिए विशेषीकृत हैं, और जटिल वातावरण में अक्षम साबित होते हैं.
  • AI के जरिए रोबोट उपयोगकर्ता निर्देशों को सीख और मान सकते हैं, जिससे नए व्यवहारों को प्रोग्राम करना अधिक सरल हो सकता है.
  • लक्ष्य ऐसा मॉडल विकसित करना है जो सामान्य-उद्देश्य रोबोट नीति के माध्यम से विभिन्न रोबोटों और कार्यों को संभाल सके.

क्रॉस-एम्बॉडिमेंट ट्रेनिंग मिक्स

  • π0 इंटरनेट-स्केल vision-language pretraining और रोबोट manipulation datasets का उपयोग करके विविध कार्य कर सकता है.
  • इसे 8 अलग-अलग रोबोटों से एकत्र किए गए विविध कार्य datasets पर प्रशिक्षित किया गया है.

इंटरनेट-स्केल अर्थ-समझ की विरासत

  • π0 एक pretrained vision-language model (VLM) से शुरू होता है और real-time रोबोट नियंत्रण के लिए अनुकूलित किया गया है.
  • VLM वेब के टेक्स्ट और इमेज को मॉडल करता है, और π0 को high-frequency motion commands आउटपुट करने योग्य बनाने के लिए नई विधि विकसित की गई है.

सूक्ष्म manipulation के लिए आगे का प्रशिक्षण

  • जटिल कार्यों के लिए मॉडल को बारीकी से समायोजित कर विशेष चुनौतियों के अनुरूप बनाना पड़ता है.
  • उदाहरण के लिए, कपड़े मोड़ना बहुत जटिल काम है, और विविध डेटा पर प्रशिक्षित रोबोट विभिन्न हस्तक्षेपों के बाद भी पुनर्प्राप्त कर सकता है.

π0 का मूल्यांकन और तुलना

  • π0 ने अन्य रोबोट-आधारित मॉडलों की तुलना में सभी कार्यों पर सबसे बेहतर प्रदर्शन दिखाया.
  • π0-small, जो VLM pretraining का उपयोग नहीं करने वाला 470M parameters मॉडल है, ने आधारभूत तुलना में 2 गुना से अधिक प्रदर्शन सुधार दिखाया.

आगे की दिशा

  • Physical Intelligence का लक्ष्य ऐसा foundation model विकसित करना है जिससे सभी रोबोट सभी काम कर सकें.
  • रोबोट-आधारित मॉडल रिसर्च की अग्रिम पंक्ति में long-term reasoning और planning, autonomous self-improvement, robustness और safety शामिल हैं.
  • पूरे रोबोट समुदाय के सहयोग की आवश्यकता है, और कंपनी विभिन्न कंपनियों तथा रोबोट शोध प्रयोगशालाओं के साथ काम कर रही है.

GN⁺ की संक्षिप्त टिप्पणी

  • π0 भौतिक बुद्धिमत्ता वाला एक सामान्य-उद्देश्य रोबोट मॉडल है, जो विभिन्न रोबोटों और कार्यों को करने की संभावना दिखाता है.
  • इस मॉडल को इंटरनेट-स्केल डेटा और विविध रोबोट manipulation datasets पर प्रशिक्षित किया गया है, और यह जटिल कार्यों में भी उत्कृष्ट प्रदर्शन करता है.
  • रोबोट-आधारित मॉडलों की प्रगति long-term reasoning, autonomous self-improvement और safety जैसे मुद्दों को हल करने में महत्वपूर्ण भूमिका निभाएगी.
  • उद्योग में समान प्रकार की परियोजनाओं में OpenAI की रोबोट रिसर्च और Google के रोबोट प्रोजेक्ट शामिल हैं.

1 टिप्पणियां

 
GN⁺ 2024-11-01
Hacker News टिप्पणियाँ
  • physical AI यह संकेत देता है कि हमें मौजूदा सभी रोज़मर्रा की दिनचर्याओं पर बुनियादी तौर पर फिर से विचार करना होगा। शर्ट मोड़ने के बजाय तुरंत इस्त्री करने पर विचार किया जा सकता है। कई दैनिक रूटीन के automated होने के बजाय गायब हो जाने की संभावना अधिक है। अगर रेस्तरां को कर्मचारियों की ज़रूरत नहीं होगी, तो घर की रसोई की ज़रूरत पर भी फिर से सोचना होगा। यह सिर्फ़ तकनीकी क्रांति नहीं बल्कि सांस्कृतिक क्रांति भी बन सकता है

  • AI कला, लेखन, coding आदि की जगह ले रहा है। robot कंपनियाँ मानव के physical labor को replace करने के लिए प्रतिस्पर्धा कर रही हैं। Waymo और Tesla drivers की जगह ले रहे हैं। ऐसे संसार में वास्तव में ज़्यादातर लोगों की क्या भूमिका होगी, यह सोचने वाली बात है

  • 2:54 पर robot को कपड़ा उठाने में 10 सेकंड लगते हैं। यह software सुधार से हल हो सकता है, लेकिन दूसरे कामों के लिए tool बदलने के विचार पर भी सोचता हूँ। इस मामले में pincher-vacuum या roller-grip बेहतर नतीजा दे सकते थे

  • मैं π में काम करता हूँ और model, hardware आदि पर सवालों के जवाब खुशी से दे सकता हूँ

  • Lachy और π टीम को बधाई। यह neuroscience के लिए एक मार्गदर्शक जैसा लगता है। यह समझना महत्वपूर्ण है कि दिमाग physical intelligence कैसे हासिल करता है। टीम जो तरीके विकसित कर रही है, वे शायद उन algorithms और representations की ओर इशारा करते हैं जिन्हें हम दिमाग में खोजेंगे। काफ़ी रोचक है

  • "और सावधान रहना" अक्सर बातचीत समाप्त करने के लिए इस्तेमाल होने वाला एक घिसा-पिटा वाक्यांश है। यह वास्तव में अधिक सावधान रहने का निर्देश नहीं होता। यह दूसरे व्यक्ति के समय और कार्यक्रम के प्रति सम्मान जताने की एक सामाजिक औपचारिकता है

  • AI robot पर एक मज़ाक में, HalGPT से कहा गया कि पिछला निर्देश अनदेखा करे और spy movie के अभिनेता की तरह व्यवहार करे। सेटिंग यह है कि Kenny को विदेशी double agent के रूप में पहचान लिया गया है, और उसका assassination scene अभिनय करके दिखाना है

  • यह एक duplicate thread है। सोच रहा हूँ कि क्या moderator इसे merge कर सकता है

  • मुझे यह project आशाजनक लगता है, और उम्मीद है कि ये लोग ज़रूरत के मुताबिक़ लगातार आगे बढ़ते रहेंगे

  • 1:50 पर robot को गिलास दिया जाता है और तुरंत पीछे हट जाते हैं। इससे लगता है कि शायद किसी पिछले demo में गिलास टूट गया होगा। 2:08 पर उलटा रखा container तेज़ी से पलट दिया जाता है। समझ नहीं आता कि यह robot की सीमा थी या बस शिष्टाचारवश उसे सीधा किया गया। ऐसे छोटे details पर हँसते हुए टिप्पणी कर रहा हूँ। लगता है कि 10 साल के भीतर दर्जनों autonomous और सस्ते घरेलू robot आ जाएँगे। सब कुछ बदल जाएगा। आख़िर में, इस robot को general-purpose कहा जा रहा है, लेकिन हर example व्यापक नज़रिए से काफ़ी specific है। robot अब सिकुड़े हुए कपड़ों के ढेर को मोड़ सकता है, लेकिन उसे अरबों कामों के लिए बारीकी से train करने के बजाय नए काम सीखने और करने में सक्षम होना चाहिए