1 पॉइंट द्वारा GN⁺ 2025-01-30 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • DeepSeek के open source होने के कारण

    • DeepSeek एक चीनी AI research lab है, जिसने R1 नाम का एक open source reasoning model विकसित किया है.
    • इसने OpenAI जैसे प्रदर्शन वाला model कम लागत में विकसित किया, और यह innovative training methods की वजह से संभव हुआ.
    • एक चीनी कंपनी होने के कारण, पश्चिमी बाज़ार में भरोसा हासिल करने के लिए इसका open source होना ज़रूरी था.
    • Open source सिर्फ़ एक technical act नहीं, बल्कि एक cultural act भी है.
  • मॉडल का commoditization

    • LLM models धीरे-धीरे commodity बनते जा रहे हैं, और performance gap बहुत बड़ा नहीं है.
    • OpenAI अब भी अग्रणी है, लेकिन DeepSeek R1 जैसे open source models कम लागत का विकल्प देते हैं.
    • Infrastructure में long term में open source के जीतने की प्रवृत्ति रहती है.
  • Infrastructure में open source के फायदे

    • Open source अधिक सस्ता होता है और customization की सुविधा देता है, लेकिन maintenance की ज़रूरत होती है.
    • Infrastructure में हमेशा customization की ज़रूरत पड़ती है, और जितना product ज़्यादा technical होता है, engineers उतना ही open source को पसंद करते हैं.
    • Lago जैसी open source कंपनियाँ इसलिए सफल होती हैं क्योंकि engineers जटिल billing systems को खुद manage कर सकते हैं.
  • OpenAI का भविष्य

    • OpenAI अब भी बाज़ार में महत्वपूर्ण स्थान रखता है और LLM व reasoning models में अपनी बढ़त बनाए हुए है.
    • यह दावा किया जाता है कि DeepSeek R1 जैसे models OpenAI की जगह ले सकते हैं, लेकिन OpenAI की innovation के बिना ऐसे models भी मौजूद नहीं होते.
    • R1 मौजूदा बड़ी कंपनियों को और अधिक efficient तरीक़े खोजने के लिए प्रेरित कर सकता है.

1 टिप्पणियां

 
GN⁺ 2025-01-30
Hacker News राय
  • चीन के बड़े मॉडल startup में केवल DeepSeek ने commercialisation पर विचार किए बिना open source को चुना। इससे उसे community के भीतर स्वाभाविक user promotion मिला।

    • DeepSeek के CEO का कहना है कि open source सबसे अच्छे talent को आकर्षित करता है और team की value बढ़ाता है।
    • यह उस रणनीति जैसा है जो अतीत में OpenAI ने Microsoft के ClosedAI division बनने से पहले अपनाई थी।
  • चीन के AI API को पश्चिम में संदेह के साथ लिया जाने की संभावना अधिक है। इसके ऐतिहासिक रूप से उचित कारण हैं।

    • DeepSeek पर चीन से जुड़े संवेदनशील सवालों के बारे में censorship करने की आलोचना होती है।
  • Google के internal memo के अनुसार, open source private teams की तुलना में अधिक तेज़ी और efficiency से आगे बढ़ रहा है।

    • ऐसा माना जाता है कि LLM का भविष्य shared research में है, और यह बहुत महत्वपूर्ण है।
  • यह तर्क दिया जाता है कि जिन companies के नाम में "open" है, उन्हें सब कुछ साझा न भी करना हो तो कम से कम महत्वपूर्ण हिस्से साझा करने चाहिए।

    • source उपलब्ध नहीं कराया गया है, इसलिए यह वास्तव में open source नहीं है।
  • जैसे Linux लंबे समय में सफल हुआ, वैसे ही मज़बूत LLM models के भी उसी राह पर चलने की उम्मीद है।

    • अंततः infrastructure का scale ही फ़र्क पैदा करेगा।
  • DeepSeek एक hedge fund का side project है, और यदि वह NVIDIA stock को short करे और सब कुछ public कर दे, तो उसे बड़ा profit मिल सकता है।

  • DeepSeek को open source करने का कारण यह है कि developers अपने बनाए हुए शानदार काम को दिखाना चाहते हैं।

    • बहुत से लोग इसके पीछे financial motive ढूँढने की कोशिश करते हैं, लेकिन वास्तव में इसे बनाने वाले लोग engineers हैं, businesspeople नहीं। DeepSeek वास्तव में एक बहुत शानदार project है, और वे अपने बनाए हुए इस शानदार काम को दिखाना चाहते थे।