OpenAI का कहना है कि उसे सबूत मिले हैं कि DeepSeek ने उसके मॉडल्स का इस्तेमाल प्रशिक्षण में किया

(ft.com)

5 पॉइंट द्वारा GN⁺ 2025-01-30 | 2 टिप्पणियां | WhatsApp पर शेयर करें

OpenAI ने Financial Times को बताया कि उसे ऐसे सबूत मिले हैं कि चीनी AI startup DeepSeek ने अपने open source प्रतिस्पर्धी मॉडल को train करने के लिए उसके proprietary मॉडल्स का इस्तेमाल किया
संदेह है कि DeepSeek ने बड़े मॉडल्स के output का उपयोग करके छोटे मॉडल्स को प्रभावी ढंग से train करने वाली "knowledge distillation" तकनीक का इस्तेमाल किया
Distillation AI उद्योग में एक आम तरीका है, लेकिन OpenAI का दावा है कि DeepSeek ने इसका उपयोग करके अपना स्वतंत्र मॉडल विकसित किया, जो उसकी सेवा शर्तों का उल्लंघन है
OpenAI की शर्तों के अनुसार, उपयोगकर्ता OpenAI के output की नकल नहीं कर सकते या उसका उपयोग प्रतिस्पर्धी मॉडल विकसित करने के लिए नहीं कर सकते

DeepSeek के मॉडल प्रदर्शन और बाज़ार की प्रतिक्रिया

DeepSeek के R1 reasoning मॉडल के लॉन्च ने tech उद्योग और निवेशकों को चौंका दिया
DeepSeek अपेक्षाकृत कम लागत में उच्च प्रदर्शन वाले मॉडल बनाकर उद्योग का ध्यान खींच रहा है
सोमवार को Nvidia का शेयर 17% गिरा, जिससे 589 अरब डॉलर का market cap मिट गया, हालांकि मंगलवार को इसमें 9% की वापसी हुई
Nvidia में गिरावट की वजह AI hardware की मांग घटने की आशंका थी

OpenAI और Microsoft की प्रतिक्रिया

OpenAI और Microsoft ने पिछले साल उन accounts की जांच कर उन्हें block किया, जिन पर DeepSeek द्वारा OpenAI API का इस्तेमाल कर distillation की कोशिश करने का संदेह था
इससे संबंधित पहली रिपोर्ट Bloomberg ने प्रकाशित की थी
Microsoft ने इस पर टिप्पणी करने से इनकार किया, और OpenAI ने भी अतिरिक्त टिप्पणी देने से मना कर दिया

विशेषज्ञों की राय

ट्रंप प्रशासन के पूर्व AI और crypto अधिकारी David Sacks ने कहा कि "IP चोरी हुई हो सकती है"
कुछ AI शोधकर्ताओं का विश्लेषण है कि DeepSeek के मॉडल में GPT-4 के output से सीखे जाने के संकेत दिखाई देते हैं
UC Berkeley के AI PhD researcher Ritwik Gupta ने समझाया कि AI उद्योग में commercial LLM के output का उपयोग करके मॉडल train करना एक सामान्य प्रथा है

OpenAI की प्रतिक्रिया और आगे का परिदृश्य

OpenAI ने चेतावनी दी कि चीन सहित कई कंपनियां अमेरिकी AI कंपनियों के मॉडल्स को distill करने की कोशिश कर रही हैं
उसने जोर दिया कि IP की सुरक्षा के लिए मॉडल की अत्याधुनिक क्षमताओं को सार्वजनिक करने पर सावधानी से निर्णय लिया जा रहा है, और तकनीक के लीक को रोकने के लिए अमेरिकी सरकार के साथ सहयोग करना महत्वपूर्ण है
लेकिन OpenAI स्वयं भी New York Times सहित समाचार संस्थानों और copyright धारकों द्वारा बिना अनुमति data इस्तेमाल करने के आरोपों में मुकदमों का सामना कर रहा है, जिससे वह अपने ही copyright विवादों में घिरा हुआ है

2 टिप्पणियां

botplaysdice 2025-02-01

OpenAI का New York Times के साथ मुकदमा चल रहा है, तो क्या ऐसे में DeepSeek उस मुकदमे से मुक्त हो जाता है? :)

GN⁺ 2025-01-30

Hacker News की राय

यह दावा कि DeepSeek ने OpenAI के डेटा का उपयोग करके ट्रेनिंग की, इसलिए यह अनुचित है, इस वजह से कमज़ोर लगता है कि OpenAI ने भी इंटरनेट से डेटा इकट्ठा करके ट्रेनिंग की थी
- यह ज़रूरी नहीं कि DeepSeek ने शुरुआत से ही o1-स्तर का प्रदर्शन दोहरा लिया हो, और इससे ट्रेनिंग दक्षता पर सवाल उठते हैं
- DeepSeek का R1 पेपर दिखाता है कि distillation बहुत शक्तिशाली है, और अगर DeepSeek ने o1 के outputs का उपयोग करके मॉडल को train किया, तो इससे ट्रेनिंग दक्षता पर सवाल उठ सकते हैं
यह राय कि DeepSeek का open source और MIT license के तहत जारी होना बड़ी प्रतिभाओं को आकर्षित करने का अवसर बन सकता है
- नई तकनीकों का open source होना अतीत में भी हमेशा प्रगति को आगे बढ़ाता रहा है
- OpenAI IP सुरक्षा के लिए अमेरिकी सरकार के साथ काम कर रहा है, और DeepSeek के TikTok की तरह ban होने की संभावना भी है
r1, o1 के बाद की दुनिया में बना है, और ऐसी स्थिति है जहाँ दूसरे मॉडल r1 को distill कर सकते हैं
- यह राय कि o1 से distill करना DeepSeek के cost claims को कमज़ोर नहीं करता
- इस पर सवाल कि क्या OpenAI के पास कोई नैतिक या एथिकल बढ़त है
अगर DeepSeek ने OpenAI से ट्रेनिंग ली है, तो इसका मतलब यह नहीं कि इसे शुरू से ही "pennies on the dollar" में train किया गया था, और यह शायद कोई तकनीकी breakthrough न हो
- यह अभी तक पुष्टि नहीं हुई है कि यह सच है या नहीं
OpenAI इस समय अपेक्षाकृत कमज़ोर स्थिति में है, और Google या Microsoft की तरह कानूनी संसाधनों का उपयोग नहीं कर सकता
- यह राय कि कानूनी मुद्दों के ज़रिए प्रतिस्पर्धियों को दबाने की OpenAI की रणनीति प्रभावी नहीं होगी
रेलवे उद्योग की तरह, AI में भी प्रतिस्पर्धा लागत को कम करेगी, और संभव है कि ज़्यादातर निवेश बड़े पैमाने की संपत्ति न बना सकें
- Nvidia, OpenAI, DeepSeek जैसी बड़ी कंपनियाँ AI में निवेश कर रही हैं, लेकिन हो सकता है कि वे वास्तविक मुनाफ़ा पैदा न कर सकें
OpenAI द्वारा बिना अनुमति content इस्तेमाल करने और AI addiction scripts को बायपास करने के लिए बहुत पैसा खर्च करने की आलोचना
- अगर DeepSeek ने OpenAI के डेटा को फिर से इस्तेमाल किया है, तो यह किसी engineering breakthrough का संकेत नहीं है
OpenAI के मॉडल को निजी ebook torrent trackers से बड़े पैमाने पर इकट्ठी की गई ebooks के आधार पर train किया गया था
- ebooks को epub फ़ॉर्मेट में बदला और व्यवस्थित किया गया था, फिर उन्हें public data repositories पर host किया गया था