Meta AI Demos

(aidemos.meta.com)

1 पॉइंट द्वारा GN⁺ 2025-02-10 | 1 टिप्पणियां | WhatsApp पर शेयर करें

Meta ने अपने नवीनतम AI प्रयोगों और तकनीकी demos को एक जगह इकट्ठा किया है, जहाँ नए tools को जल्दी आज़माया जा सकता है
FAIR और Meta की अन्य research teams के प्रयोगों सहित, यह research, creativity और technology के संगम पर मौजूद ideas को कवर करता है
Demos को latest model-based tools, Segment Anything से जुड़े tools, playful lightweight demos, और research outcomes पर केंद्रित technical demos में बाँटा गया है
Users नए AI tools को test करते हुए AI technology development process में योगदान दे सकते हैं
कुछ technologies आगे चलकर Meta products में integrate हो सकती हैं, इसलिए यह experimental-stage features को पहले से देखने की एक window बनता है

Meta का AI प्रयोगों को explore करने वाला space

AI Demos, Meta द्वारा बनाए गए नवीनतम AI प्रयोगों और technical demos को एक जगह दिखाता है
इसमें FAIR और Meta की दूसरी research teams द्वारा बनाए गए demos शामिल हैं
Users नए AI tools तक early access पाकर उन्हें सीधे test कर सकते हैं

Demo structure

Featured Experiments
- Latest model capabilities से चलने वाले tools देखे जा सकते हैं
Featured Segment Anything tools
- Segment Anything से जुड़े tools को अलग category में रखा गया है
Playful Ideas
- Creativity और play के लिए lightweight demos को कवर करता है
Technical Explorations
- नए research outcomes दिखाने वाले technical demos शामिल हैं
- Users की testing AI technology development में योगदान दे सकती है, और कुछ technologies आगे Meta products में integrate हो सकती हैं

1 टिप्पणियां

GN⁺ 2025-02-10

Hacker News की राय

यह डेमो टूल्स का एक संग्रह है, और Segment Anything 2 कुछ क्लिक में वीडियो कटआउट और visual effects बना सकता है
Seamless Translation आपकी अपनी आवाज़ को दूसरी भाषा में बोलते हुए सुनाता है, Animated Drawings हाथ से बने स्केच को animation में जीवंत कर देता है, और Audiobox AI-जनरेटेड voice और sound के साथ audio stories बनाने देता है
- इसमें लिखा है, “यह research demo Illinois या Texas के निवासियों, या उन राज्यों से access करने वाले लोगों के लिए खुला नहीं है”
  Illinois या Texas में इसे access नहीं किया जा सकता, शायद voice conversion वाली चीज़ की वजह से यह AI-संबंधित कानूनों के दायरे में आता है
  अच्छा होगा अगर lawmakers उपयोगी use cases भी देखें, और पूरे generative AI को मोटे तौर पर रोकने के बजाय misuse को target करने के लिए कानूनों में बदलाव करें
Seamless Translation काफ़ी चौंकाने वाला है
मैंने अंग्रेज़ी और स्पेनिश के साथ इसे आज़माया, एक अंग्रेज़ी वाक्य रिकॉर्ड किया और स्पेनिश output सुना, और वह मेरी स्पेनिश के काफ़ी क़रीब था
बेशक मेरी स्पेनिश में Castilian शैली की अभिव्यक्तियाँ ज़्यादा हैं, लेकिन मुझे यह उम्मीद नहीं थी कि वह उसे पहचान लेगा
- असली टेस्ट शायद यह होगा कि Argentina के Mendoza से मेरे एक दोस्त को इसे इस्तेमाल करने दिया जाए
  मैं bilingual हूँ, फिर भी आज तक उसकी बात ठीक से समझ नहीं पाता, और आधी बातों में तो यक़ीन ही नहीं होता कि वे सचमुच शब्द हैं
- मैंने इसे इस्तेमाल किया, लेकिन यह मेरी आवाज़ जैसा बिल्कुल नहीं लगा; बस एक “सामान्य” पुरुष आवाज़ थी जो मेरी बात जर्मन में अनुवाद कर रही थी
  मेरी पत्नी ने कहा, “ठीक नहीं है, बिल्कुल तुम्हारी आवाज़ जैसी नहीं लगती,” और मेरे लिए वही काफ़ी था
- असली बात यह है कि आवाज़ सच में आपकी जैसी लगती है या नहीं, और मेरे मामले में तो बिल्कुल नहीं लगी
- यह बहस अभी जारी है कि translation technology “अब वहाँ पहुँच गई है” या नहीं, लेकिन किसी समय यह ज़्यादातर practical uses के लिए काफ़ी अच्छी मानी जाएगी और भाषा की बाधा को लगभग ख़त्म कर देगी
  तब यह तय है कि इसका बोलचाल की भाषा पर भी कुछ असर पड़ना शुरू होगा, जो डरावना भी है और दिलचस्प भी
- दिए गए examples इतने ख़राब और robotic थे कि निराशा हुई
  मेरा खुद इसे आज़माने का मन ही हट गया, हालाँकि शायद मैं फिर से सोचूँ
HN के title की तरह क्या इसे जानबूझकर Aidemos लिखा गया है, या फिर AI Demos ही सही है, यह जानने की जिज्ञासा है
- HN submission title के uppercase/lowercase को अपने-आप फिर से सेट कर देता है, इसलिए संभव है कि इसे मूल रूप से “AIDemos by Meta” के रूप में submit किया गया हो
Seamless Translation डेमो शानदार है
अनुवादित आवाज़ भी मेरी असली आवाज़ जैसी मानने लायक थी, और अगर यह real-time में हो सके तो बहुत बड़ा होगा
- यह पहले से संभव है
  Kyutai ने पिछले हफ़्ते on-device चलने वाला real-time speech translation डेमो दिखाया था, और अभी यह iPhone 16 Pro पर सिर्फ़ French→English translation में काम करता है: https://x.com/neilzegh/status/1887498102455869775
  उन्होंने inference code और weights भी जारी किए हैं, और उन्हें GitHub पर देखा जा सकता है: https://github.com/kyutai-labs/hibiki
यह ठीक-ठीक समझ नहीं आता कि Meta AI से हासिल क्या करना चाहता है
लगता है रिसर्च बहुत कर रहा है, लेकिन उसका अंतिम लक्ष्य क्या है यह अस्पष्ट है; Google या MSFT को समझना आसान है, लेकिन Meta उतना स्पष्ट नहीं लगता
- लगता है Meta मानता है कि AI प्रतिस्पर्धा के अंत में पैसा data center या model में नहीं, बल्कि closed ecosystem और proprietary data में बनेगा
  जब तक model और data center bottleneck बने रहेंगे, तब तक वह यह सुनिश्चित करने के लिए हर संभव काम करेगा कि कोई Meta को हिला न सके
  यह कुछ वैसा है जैसे Google ने search को रोकने वाले closed ecosystem बनने से रोकने के लिए web की application layer को monetize करना कठिन बना दिया
  प्रतिस्पर्धा के अंत में अगर model और hardware commodity बन जाते हैं, तो Meta के पास व्यक्ति और समूह स्तर पर पूर्ण psychological profiles होंगे, जिनका अध्ययन करके वह बेहद सटीक content दे सकेगा
  असली प्रतिद्वंद्वी शायद ‘her’ जैसे apps हो सकते हैं, जो लोगों को social media से निकालकर उनकी अपनी अलग-थलग दुनिया में भेज दें; और कुछ मायनों में Discord, Meta ecosystem का एक alternative world है। खासकर इसलिए कि वह hyper-focused, invite-only, छोटे समुदायों पर टिका है
- https://gwern.net/complement
  Joel Spolsky ने 2002 में tech business का जो बड़ा pattern बताया था, वह complementary commoditization है
  vertical integration के बजाय, कई जरूरी layers से बने product में एक layer पर कब्जा करना और उसके ऊपर-नीचे की layers में competition को बढ़ावा देना ताकि कोई competitive monopolist न उभरे, और stack के बाकी हिस्सों की कीमत को marginal cost तक नीचे लाकर कुल कीमत घटाना और demand बढ़ाना—यह उसकी रणनीति है
  चाहे मूल product कितना भी मूल्यवान हो और उससे पैसे वसूले जा सकते हों, अगर उसे मुफ्त करने से कहीं और का मुनाफा बढ़ता है, तो उसे free करना अधिक मूल्यवान हो सकता है
  इसका classic उदाहरण यह है कि Microsoft के OS monopoly ने PC hardware को commodity बना दिया, जिससे IBM के लिए नुकसान और MS के लिए फायदा हुआ
  यह pattern यह भी समझाता है कि बड़ी tech कंपनियां उन क्षेत्रों में क्यों उतरती हैं जो ऊपर से असंबंधित या आत्मघाती लगते हैं। Internet कंपनियों का open source में ऊंचा योगदान, और Google का smartphone manufacturing, web browser development, statistical software, fiber network, municipal WiFi, wireless spectrum auctions, और DNS में उतरना—ये सब stack की दूसरी कंपनियों को पहले से commodity बनाने की कोशिश, या खुद ऐसा होने से बचाव के रूप में देखे जा सकते हैं
- मैं भी इसे लेकर उत्सुक था, लेकिन अभी यह ज़्यादातर exploration phase जैसा लगता है
  पहले इसने थोड़ा crypto छुआ था, और अब लगभग खत्म हो चुके “metaverse” experiment जैसा कुछ किया था। बेशक, ऐसी exploration में भी कभी-कभी बहुत बड़ा पैसा लग जाता है
  ये demos यह जरूर दिखाते हैं कि AI का इस्तेमाल कहाँ हो सकता है, लेकिन क्या यह Meta के business को सच में game-changing तरीके से बदल देगा, या आम users के लिए अच्छा होगा—यह अभी खुला सवाल है
  Facebook और Instagram का पुराना और बेहद खराब UI दस साल से भी ज्यादा समय में लगभग नहीं बदला, और 70,000 कर्मचारियों वाली कंपनी होने के बावजूद आजकल यह उपयोगिता से ज्यादा ads को और आक्रामक तरीके से ठूंसने पर केंद्रित लगती है
  भले ही business 20 साल पुराने, जर्जर और bug भरे Facebook और 10 साल से ज्यादा पुराने Instagram app पर ही टिका रहे, अगर यह React की तरह open source models की प्रगति में योगदान देता है, तो कुल मिलाकर यह फायदेमंद है
- हो सकता है कि ‘metaverse’ के फेल होने के बाद वह किसी और चीज़ पर पैसा उड़ाने को बेचैन हो, जो अगला The Future(TM) बन सकती है
  भले ही कोई माने कि LLM अगली बड़ी लहर होने की संभावना कम है, Meta के नजरिए से यह काफी तर्कसंगत हो सकता है। उसके पास बहुत पैसा और revenue है, इसलिए हर नए trend पर दांव लगाते रहना, ताकि उनमें से कोई एक सच निकले तो पीछे न रह जाए, और अगर न भी निकले तो नुकसान झेल सके—यह उसके लिए संभव है
  मुझे शक है कि ज़्यादातर Big Tech का LLMs में interest भी आखिरकार risk management के ज्यादा करीब है
- इस क्षेत्र से जुड़े एक व्यक्ति से सुनी बात को खोलकर कहें तो, Meta के AI का उद्देश्य ad targeting को बेहतर बनाना है
  इसमें बेहतर classification और clustering, advertisers के लिए बेहतर “recommendations”, और visual elements, copy, यहां तक कि video भी शामिल हैं
  ये demos शायद side effect हैं, या एक तरह के “greenwashing” के करीब। Meta का core और practically एकमात्र business ads है, और बाकी हर monetization कोशिश असफल रही है
Segment Anything demo काफी प्रभावशाली है, लेकिन यह जानना दिलचस्प होगा कि क्या यह किसी वास्तविक product में integrated है
मैं शौकिया तौर पर दोस्तों के लिए साधारण video editing करता हूँ, और यह काफी उपयोगी लगता है
[0] https://sam2.metademolab.com/
- Photoroom [0] Y Combinator से निकला है, और उसका product मूल रूप से SAM पर काफी polishing और अच्छा user experience चढ़ा देने जैसा है
  पता नहीं वे वास्तव में इसका इस्तेमाल करते हैं या नहीं, लेकिन अगर नहीं करते तो करना चाहिए
  [0] https://www.photoroom.com/
- image generation models के लिए frontend SwarmUI ने SAM2 को integrate किया है, ताकि inpainting जैसे कामों में image के हिस्सों को जल्दी mask किया जा सके
  बहुत अच्छा है
- शायद यह पहले से इस्तेमाल हो रहा होगा, लेकिन संभवतः इसका प्रचार उस तरह नहीं किया जाएगा
जिन लोगों को जिज्ञासा हो, उनके लिए जोड़ दूँ कि Meta FAIR का मतलब पहले “Facebook Artificial Intelligence Research” था, और बाद में इसका नाम “Meta AI” कर दिया गया[1]
[1]: https://en.wikipedia.org/wiki/Meta_AI
यह सूची पूरी नहीं है
उदाहरण के लिए, humanoid control model Meta Motivo का demo https://metamotivo.metademolab.com/ इसमें शामिल नहीं है
Meta GPT-3 और ChatGPT के अंतर के प्रभाव को गहराई से समझता है
model सिर्फ शुरुआती बिंदु है; उस model के साथ आप कैसा user experience बनाते हैं, वही intelligence को प्रकट करता है
यह खासकर visual models में और ज्यादा साफ दिखता है: SAM2 के बारे में “यह anything देख सकता है” कहना बस थोड़ा रोचक है, लेकिन जब आप football पर click करते हैं और वह ढका होने पर भी पूरे video में उसे smoothly track करता रहता है, तो वह सचमुच चौंकाता है
“फ़िलहाल इस क्षेत्र में साइट का उपयोग नहीं किया जा सकता” दिखता है
- अंतरराष्ट्रीय बाज़ार और अमेरिका के कुछ राज्यों में AI नियम अलग-अलग हैं, इसलिए कंपनियों को AI प्रोडक्ट्स बहुत सावधानी से संभालने पड़ते हैं
  इसी वजह से अत्याधुनिक मॉडल कभी-कभी कुछ क्षेत्रों में देर से उपलब्ध होते हैं
  हर छोटे डेमो के लिए सभी compliance की जाँच करना और उसका documentation तैयार करना, लागत के मुकाबले शायद कम मूल्य का काम है, इसलिए संभवतः इसे केवल अमेरिका और कुछ क्षेत्रों में ही अनुमति दी गई होगी
- अमेरिका में भी यह संदेश दिखता है
- मैंने अमेरिका के भीतर यह संदेश देखा, लेकिन VPN को LA पर सेट करने पर इसे bypass किया जा सका
  शायद इसलिए कि Meta के इंजीनियर वहीं हैं ¯\(ツ)/¯
  अंदर जाने के बाद यह लिखा था:
  “यह research demo Illinois या Texas के निवासियों, या उन राज्यों से एक्सेस करने वाले लोगों के लिए खुला नहीं है”
  मैं Texas में हूँ

Meta AI Demos

Meta का AI प्रयोगों को explore करने वाला space

Demo structure

Featured Experiments

Featured Segment Anything tools

Playful Ideas

Technical Explorations

संबंधित पढ़ाई

1 टिप्पणियां

Hacker News की राय