- OpenAI ने Financial Times को बताया कि उसे ऐसे सबूत मिले हैं कि चीनी AI startup DeepSeek ने अपने open source प्रतिस्पर्धी मॉडल को train करने के लिए उसके proprietary मॉडल्स का इस्तेमाल किया
- संदेह है कि DeepSeek ने बड़े मॉडल्स के output का उपयोग करके छोटे मॉडल्स को प्रभावी ढंग से train करने वाली "knowledge distillation" तकनीक का इस्तेमाल किया
- Distillation AI उद्योग में एक आम तरीका है, लेकिन OpenAI का दावा है कि DeepSeek ने इसका उपयोग करके अपना स्वतंत्र मॉडल विकसित किया, जो उसकी सेवा शर्तों का उल्लंघन है
- OpenAI की शर्तों के अनुसार, उपयोगकर्ता OpenAI के output की नकल नहीं कर सकते या उसका उपयोग प्रतिस्पर्धी मॉडल विकसित करने के लिए नहीं कर सकते
DeepSeek के मॉडल प्रदर्शन और बाज़ार की प्रतिक्रिया
- DeepSeek के R1 reasoning मॉडल के लॉन्च ने tech उद्योग और निवेशकों को चौंका दिया
- DeepSeek अपेक्षाकृत कम लागत में उच्च प्रदर्शन वाले मॉडल बनाकर उद्योग का ध्यान खींच रहा है
- सोमवार को Nvidia का शेयर 17% गिरा, जिससे 589 अरब डॉलर का market cap मिट गया, हालांकि मंगलवार को इसमें 9% की वापसी हुई
- Nvidia में गिरावट की वजह AI hardware की मांग घटने की आशंका थी
OpenAI और Microsoft की प्रतिक्रिया
- OpenAI और Microsoft ने पिछले साल उन accounts की जांच कर उन्हें block किया, जिन पर DeepSeek द्वारा OpenAI API का इस्तेमाल कर distillation की कोशिश करने का संदेह था
- इससे संबंधित पहली रिपोर्ट Bloomberg ने प्रकाशित की थी
- Microsoft ने इस पर टिप्पणी करने से इनकार किया, और OpenAI ने भी अतिरिक्त टिप्पणी देने से मना कर दिया
विशेषज्ञों की राय
- ट्रंप प्रशासन के पूर्व AI और crypto अधिकारी David Sacks ने कहा कि "IP चोरी हुई हो सकती है"
- कुछ AI शोधकर्ताओं का विश्लेषण है कि DeepSeek के मॉडल में GPT-4 के output से सीखे जाने के संकेत दिखाई देते हैं
- UC Berkeley के AI PhD researcher Ritwik Gupta ने समझाया कि AI उद्योग में commercial LLM के output का उपयोग करके मॉडल train करना एक सामान्य प्रथा है
OpenAI की प्रतिक्रिया और आगे का परिदृश्य
- OpenAI ने चेतावनी दी कि चीन सहित कई कंपनियां अमेरिकी AI कंपनियों के मॉडल्स को distill करने की कोशिश कर रही हैं
- उसने जोर दिया कि IP की सुरक्षा के लिए मॉडल की अत्याधुनिक क्षमताओं को सार्वजनिक करने पर सावधानी से निर्णय लिया जा रहा है, और तकनीक के लीक को रोकने के लिए अमेरिकी सरकार के साथ सहयोग करना महत्वपूर्ण है
- लेकिन OpenAI स्वयं भी New York Times सहित समाचार संस्थानों और copyright धारकों द्वारा बिना अनुमति data इस्तेमाल करने के आरोपों में मुकदमों का सामना कर रहा है, जिससे वह अपने ही copyright विवादों में घिरा हुआ है
2 टिप्पणियां
OpenAI का New York Times के साथ मुकदमा चल रहा है, तो क्या ऐसे में DeepSeek उस मुकदमे से मुक्त हो जाता है? :)
Hacker News की राय
यह दावा कि DeepSeek ने OpenAI के डेटा का उपयोग करके ट्रेनिंग की, इसलिए यह अनुचित है, इस वजह से कमज़ोर लगता है कि OpenAI ने भी इंटरनेट से डेटा इकट्ठा करके ट्रेनिंग की थी
यह राय कि DeepSeek का open source और MIT license के तहत जारी होना बड़ी प्रतिभाओं को आकर्षित करने का अवसर बन सकता है
r1, o1 के बाद की दुनिया में बना है, और ऐसी स्थिति है जहाँ दूसरे मॉडल r1 को distill कर सकते हैं
अगर DeepSeek ने OpenAI से ट्रेनिंग ली है, तो इसका मतलब यह नहीं कि इसे शुरू से ही "pennies on the dollar" में train किया गया था, और यह शायद कोई तकनीकी breakthrough न हो
OpenAI इस समय अपेक्षाकृत कमज़ोर स्थिति में है, और Google या Microsoft की तरह कानूनी संसाधनों का उपयोग नहीं कर सकता
रेलवे उद्योग की तरह, AI में भी प्रतिस्पर्धा लागत को कम करेगी, और संभव है कि ज़्यादातर निवेश बड़े पैमाने की संपत्ति न बना सकें
OpenAI द्वारा बिना अनुमति content इस्तेमाल करने और AI addiction scripts को बायपास करने के लिए बहुत पैसा खर्च करने की आलोचना
OpenAI के मॉडल को निजी ebook torrent trackers से बड़े पैमाने पर इकट्ठी की गई ebooks के आधार पर train किया गया था