- Linux performance management के मशहूर विशेषज्ञ और BPF के मुख्य contributor Brendan Gregg ने OpenAI में शामिल होने की वजह बताई
- तेज़ी से बढ़ती AI data center लागत और energy consumption की समस्या हल करने के लिए OpenAI में शामिल हुए, और शुरुआत में ChatGPT performance optimization पर ध्यान केंद्रित किया
- उनका मानना था कि पारंपरिक performance engineering की अपनी सीमाएँ हैं, इसलिए उन्होंने नई engineering methods के ज़रिए बड़े optimization gains जल्दी खोजने का लक्ष्य रखा
- रोज़मर्रा के users द्वारा ChatGPT के व्यापक उपयोग—जैसे हेयरस्टाइलिस्ट, real estate agent, tax consultant, beekeeper—को देखकर उन्होंने तकनीक के सामाजिक प्रसार को महसूस किया
- 26 interviews के दौरान कई AI कंपनियों के engineering स्तर की तुलना की, और कहा कि OpenAI की talent density और collaboration environment सबसे प्रभावशाली थे
- OpenAI में अपनी भूमिका को उन्होंने वैश्विक पैमाने पर efficiency improvement और sustainability में योगदान देने का जीवन-परिवर्तनकारी अवसर माना
AI data center और performance engineering की चुनौतियाँ
- AI data center की लागत और growth speed इतिहास में अभूतपूर्व है, और इसे सिर्फ़ cost reduction नहीं बल्कि पृथ्वी के पर्यावरण की रक्षा का मुद्दा माना गया
- OpenAI में इस समस्या को सीधे हल करने के लिए शामिल हुए, और शुरुआती फोकस ChatGPT performance improvement पर रखा
- मौजूदा performance engineering की सीमाओं से आगे बढ़कर बड़े optimization और तेज़ improvements के लिए नए approaches तलाशने की बात कही
- बड़े पैमाने के environment में भी ऐसी खुली संरचना पर ज़ोर दिया गया जहाँ बदलाव को रोकने वाली बाधाएँ लगभग न के बराबर हों
- इसे इस सोच से समझाया: “कुछ भी आज़माओ, बड़े पैमाने पर करो, और अभी करो”
ChatGPT का रोज़मर्रा में प्रसार और व्यक्तिगत प्रेरणा
- AI adoption को लेकर संदेह में रहने के दौरान, हेयरस्टाइलिस्ट Mia के साथ बातचीत में उन्होंने ChatGPT के जन-स्तरीय उपयोग को सीधे महसूस किया
- Mia ने बताया कि वह दोस्त की travel destination जानकारी ChatGPT से जाँचती है और भावनात्मक जुड़ाव बनाए रखने जैसे कई तरीकों से इसका इस्तेमाल करती है
- ChatGPT की memory feature को उन्होंने ऐसे अनुभव की तरह बताया मानो किसी इंसान से बात हो रही हो
- real estate agent, tax consultant, और beekeeper जैसे लोग भी ChatGPT का कामकाजी उपयोग सक्रिय रूप से कर रहे हैं
- उदाहरण: एक beekeeper छोटे business के paperwork को ChatGPT से संभालता है
- इन अनुभवों से उन्हें एहसास हुआ कि ChatGPT एक रोज़मर्रा के tool के रूप में स्थापित हो चुका है, और तकनीकी योगदान के सामाजिक महत्व पर उनका विश्वास मज़बूत हुआ
OpenAI चुनने की वजह और interview प्रक्रिया
- कई industry experts की सिफारिश पर OpenAI सहित AI technology giants के साथ 26 interviews किए
- Netflix के समय जैसा large-scale cloud environment, तेज़ code changes, और engineers की autonomy यहाँ दिखी
- सिर्फ़ GPU ही नहीं, बल्कि पूरे technology stack में performance issues पर काम करने के व्यापक अवसर मौजूद थे
- OpenAI में उनके कई परिचित कुशल engineer सहयोगी पहले से काम कर रहे थे
- Netflix के सहकर्मी Vadim जैसे लोगों के साथ सहयोग का अनुभव शामिल होने के फ़ैसले में सकारात्मक रहा
- उन्होंने कहा कि OpenAI में पहले से अनुभवी performance engineers की टीम मौजूद है, और वह उनमें “सबसे हाल में शामिल हुआ व्यक्ति” हैं
बचपन का सपना ‘Orac’ और AI का संबंध
- बचपन में ब्रिटिश SF drama Blake’s 7 के supercomputer Orac से प्रभावित होकर AI development का सपना देखा था
- कॉलेज के समय natural language processing software खुद बनाने की कोशिश की, लेकिन memory constraints के कारण रोकना पड़ा
- ChatGPT का उपयोग करते हुए उन्हें Orac याद आया, और ChatGPT ने Orac के व्यक्तित्व को पूरी तरह दोहराने वाले जवाब दिए, जिससे वह प्रभावित हुए
- बाद में उन्होंने ChatGPT settings में इसे Orac mode के रूप में personalize करके उपयोग करना शुरू किया
- Blake’s 7 के reboot की खबर का भी ज़िक्र किया
OpenAI में वर्तमान भूमिका और आगे की योजना
- वह इस समय Sydney से remotely काम कर रहे हैं और ChatGPT performance engineering team में Member of Technical Staff के रूप में कार्यरत हैं
- शुरुआती project में cross-org collaboration के ज़रिए performance improvement और cost reduction strategy बनाना शामिल है
- eBPF, Ftrace, PMC जैसी मौजूदा technologies को OpenAI की ज़रूरतों के अनुसार लागू करने की योजना है
- Codex का उपयोग वह coding के अलावा कई तरह के कामों में भी कर रहे हैं
- Intel छोड़ने के बाद Linux Plumber’s Conference में कई लोगों ने उनके अगले कदम के बारे में पूछा, और इसी कारण उन्होंने यह लेख लिखा
- अंत में, जब उन्होंने हेयरस्टाइलिस्ट Mia से फिर पूछा कि क्या वह अभी भी ChatGPT इस्तेमाल करती हैं, तो जवाब मिला: “मैं इसे 24 घंटे इस्तेमाल करती हूँ”
- यह लेख व्यक्तिगत रिकॉर्ड है और कंपनी के अनुरोध पर नहीं, बल्कि स्वेच्छा से लिखा गया है
3 टिप्पणियां
अगर दुनिया की 40% मेमोरी जमा करके रखने वाली कंपनी यह कहे कि वह पृथ्वी के सार्वजनिक हित की भी परवाह करती है तो...
ये फिर क्या है... chipset से लेकर data center तक, OpenAI की स्थिति ऐसी है कि वह खुद बनाकर इस्तेमाल करने लायक़ कुछ भी नहीं रखता; उसके लिए अगर software stack optimize हो जाए, तो जितनी अतिरिक्त क्षमता बचेगी उतना scale-up करेगा, इसलिए पर्यावरण संरक्षण से ज़्यादा लक्ष्य मुनाफ़े को अधिकतम करना है (HN comment की तरह Jevons paradox)।
यह पोस्ट इतनी ज़्यादा self-PR लगती है कि देखना भी असहज लगता है।
Hacker News की प्रतिक्रियाएँ
“लागत घटाना नहीं, बल्कि धरती को बचाना” वाली बात कुछ अटपटी लगती है
ऐसा लगता है कि कहीं असली वजह सिर्फ पैसे तो नहीं
काम के प्रति जुनून होना अच्छी बात है, लेकिन खुद को Mother Teresa जैसा दिखाने की ज़रूरत नहीं है
वैसे, इससे Silicon Valley TV शो का यह पैरोडी सीन याद आता है
बड़ी कंपनियों का लक्ष्य दुनिया बचाना नहीं, मुनाफा कमाना होता है
हार्डवेयर ज़्यादा efficient होगा तो अंत में बस और ज़्यादा workload उससे भर दिया जाएगा
फिर भी इस समस्या-क्षेत्र से निकलने वाले नए innovation को लेकर उत्सुकता है
Brendan की किताबों का फैन होने के नाते, उसके OpenAI जॉइन करने का समर्थन है, लेकिन उसके विश्लेषण से सहमत होना मुश्किल है
अगर OpenAI X डॉलर में Y मात्रा की energy खरीदता है, तो efficiency में सुधार सिर्फ और ज़्यादा tokens बनाने में जाएगा
यह energy saving नहीं, बल्कि Jevons paradox के ज़्यादा करीब है
हालांकि “chatbot से basketball score पूछना” जैसी requests की energy cost कम हो सकती है
उसने compensation की बात की, लेकिन वजह सिर्फ पैसा नहीं थी
वह AI data centers की energy cost की समस्या को सीधे हल करना चाहता था
पिछले 20 सालों में उसने लगभग minimum wage जैसी दर पर किताबें लिखकर दूसरे developers की मदद की,
और open source के ज़रिए अनगिनत startups की बुनियाद बनाई
remote work culture के फैलाव में भी योगदान दिया
efficiency बढ़ती है तो आखिर में और ज़्यादा GPU खरीदे जाते हैं
ऐसे side effects कम करने के लिए regulation ज़रूरी है
“दुनिया के लिए काम” जैसी बात खोखली लगती है
निराशा होती है, लेकिन यह आपका फैसला है, इसलिए उसका सम्मान है
संबंधित लिंक
लेकिन OpenAI competitive advantage के लिए कुछ चीज़ें private भी रख सकता है
लेख का आत्मप्रशंसात्मक लहजा इतना ज़्यादा था कि पढ़ना मुश्किल हो गया
“हेयरस्टाइलिस्ट Mia ने जब सुना कि मैं Intel Fellow हूँ, तो चुप हो गई” वाला हिस्सा असहज लगा
ऐसा लगा जैसे वह उसे प्रभावित करना चाहता था, और प्रतिक्रिया न मिलने पर नौकरी बदलने का फैसला कर लिया
tech industry के बाहर की दुनिया से सामना हो तो ऐसी प्रतिक्रिया स्वाभाविक है
उलटे, हेयरस्टाइलिस्ट ने जिस scissors brand का नाम लिया हो, वह हमें अनजान लग सकता है
Silicon Valley की hiring शैली लोगों की self-image को उकसाती है
ताकि वे खुद को दुनिया बदलने वाला समझें,
और उसी वजह से नकारात्मक प्रभावों को सीधे देख पाना कठिन हो जाता है
यह देखना चौंकाने वाला है कि इतना बेहतरीन systems engineer ऐसा ज़मीन से कटा हुआ लेखन कर रहा है
ऐसा लगता है कि तकनीकी सच्चाई से ज़्यादा राजनीति और self-promotion को प्राथमिकता दी गई
खुद को या अपने ideas को promote करना भी आखिरकार engineering का विस्तार माना जा सकता है
एक फैन के रूप में मैंने यह लेख पढ़ा, लेकिन “दुनिया को बचाना” वाली बात self-justification जैसी लगी
यह कुछ ऐसा विडंबनापूर्ण रूपक लगता है जैसे “टायर में लगी आग से जितनी हो सके उतनी गर्मी निकालकर धरती बचाऊँगा”
दोस्त दूर यात्रा पर था, इसलिए ChatGPT से उस शहर के बारे में बात करके उसे जुड़ाव का एहसास हुआ — यह हिस्सा दुखद लगा
इस तरह के इस्तेमाल के लिए gigawatt स्तर की बिजली की ज़रूरत नहीं है
एक छोटा local model ही काफी है
इंसानों के बीच asynchronous communication तो पहले से हल की जा चुकी समस्या है
travel show देखने से यह कम उदास करने वाला लगता है