1 पॉइंट द्वारा GN⁺ 2025-02-10 | 1 टिप्पणियां | WhatsApp पर शेयर करें

1 टिप्पणियां

 
GN⁺ 2025-02-10
Hacker News की राय
  • यह विभिन्न डेमो टूलबॉक्स का विवरण है

    • Segment Anything 2: कुछ क्लिक में वीडियो cutout और मज़ेदार visual effects बनाता है
    • Seamless Translation: अपनी ही आवाज़ को दूसरी भाषा में सुनने का अनुभव देता है
    • Animated Drawings: हाथ से बनाए गए sketch को animation के साथ जीवंत बनाता है
    • Audiobox: AI से जनरेट की गई आवाज़ों और sound का उपयोग करके audio story बनाता है
  • Seamless Translation काफ़ी चौंकाने वाली सुविधा है

    • जब अंग्रेज़ी और स्पेनिश बोलने वाले उपयोगकर्ता ने अंग्रेज़ी वाक्य रिकॉर्ड किया और जनरेट किया गया स्पेनिश output सुना, तो वह उसकी अपनी स्पेनिश आवाज़ से काफ़ी मिलता-जुलता था
    • हालांकि, उपयोगकर्ता की स्पेनिश में Castilian Spanish के अधिक विशिष्ट expressions शामिल हैं
  • समझ नहीं आता कि शीर्षक में Aidemos क्यों लिखा है

  • Meta के AI research की दिशा को लेकर जिज्ञासा है

    • Google और MSFT का लक्ष्य समझ में आता है, लेकिन Meta का अंतिम लक्ष्य क्या है यह स्पष्ट नहीं है
  • Seamless Translation डेमो शानदार है

    • अनुवादित आवाज़ अपनी मूल आवाज़ जैसी लगती है
    • अगर इस सुविधा को real-time में लागू किया जा सके, तो यह कमाल होगा
  • Meta GPT-3 और ChatGPT के प्रभाव को गहराई से समझता है

    • मॉडल सिर्फ़ शुरुआत है, और मॉडल का उपयोग करने वाला UX ही intelligence दिखाता है
    • यह खासकर visual models में अधिक स्पष्ट है
    • SAM2 का "कुछ भी देख सकता है" कहना दिलचस्प है
    • फुटबॉल को क्लिक करना और मॉडल को वीडियो में उसके ढक जाने पर भी उसे smoothly track करते देखना प्रभावशाली है
  • इसमें सभी डेमो शामिल नहीं हैं

    • उदाहरण के लिए, Meta Motivo डेमो गायब है (humanoid control model)
  • "वर्तमान में आपकी लोकेशन में यह साइट उपलब्ध नहीं है" संदेश दिखाई देता है

  • सोच रहा हूँ कि मॉडल्स के सभी लिंक कहाँ हैं

  • दिलचस्प है, लेकिन अच्छा होता अगर Meta साफ़ तौर पर बताता कि वह वास्तव में चाहता क्या है

    • शायद इसका मतलब है, "कृपया मॉडल को आगे train करने के लिए In the Wild data दीजिए"
  • कुछ साल पहले age estimation तकनीक का उपयोग करने का अनुभव रहा है

    • उपयोगकर्ता image upload करता था और face landmark points के 10% को align करने में मदद करता था, फिर estimator चलाया जाता था
    • यदि परिणाम गलत होता, तो सुधार के लिए feedback लिया जाता था
    • अब भी अच्छा है, लेकिन पिछले अनुभव की तुलना में बहुत बड़ा प्रभाव नहीं छोड़ता