AI की प्रगति के साथ बने रहने का मेरा तरीका (और आपको भी यह ज़रूर क्यों करना चाहिए)
(blog.nilenso.com)- Generative AI सबसे तेज़ी से विकसित होने वाली तकनीक है, इसलिए इसे कम आँकना और ज़्यादा आँकना — दोनों ही ख़तरनाक हैं
- विश्वसनीय स्रोतों और भरोसेमंद विशेषज्ञों को लगातार फ़ॉलो करना ज़रूरी है
- Simon Willison’s Blog, Andrej Karpathy, Every’s Chain of Thought जैसे संतुलित सूचना पाइपलाइन की सिफारिश की गई है
- आधिकारिक AI लैब घोषणाएँ, engineering blogs, papers तकनीक की वास्तविक प्रगति और सीमाओं को समझने के लिए अनिवार्य हैं
- Twitter/X, news curation, expert lists जैसे कई चैनलों से ताज़ा रुझानों और गहन विश्लेषण — दोनों तक पहुँचा जा सकता है
परिचय: AI को लेकर ग़लतफ़हमियाँ और सूचना प्रदूषण
- Generative AI लेखक के जीवनकाल की सबसे तेज़ी से आगे बढ़ने वाली तकनीक है
- लेकिन AI को लेकर ग़लतफ़हमियाँ भी बहुत फैली हुई हैं, और समूचा सूचना-पर्यावरण काफ़ी अव्यवस्थित है
- ऐसे कई वास्तविक मामले सामने आते हैं जहाँ कंपनियाँ, सरकारें या लोग, जो संबंधित तकनीक को पर्याप्त रूप से नहीं समझते, उसका दुरुपयोग करते हैं या गंभीर नुकसान पहुँचाते हैं
- AI को कम आँकने (“जल्द ख़त्म हो जाने वाला ट्रेंड”) और ज़्यादा आँकने (“अब programmers की ज़रूरत नहीं रहेगी”) जैसी दोनों ध्रुवों वाली ग़लतफ़हमियाँ मौजूद हैं
- तकनीक की सही समझ की कमी ही इन ग़लतफ़हमियों की जड़ है
AI जानकारी हासिल करने का तरीका
- AI से जुड़ी जानकारी को सही तरह समझना, जितना लगता है उससे ज़्यादा मुश्किल है
- यह ऐसा माहौल है जहाँ विकृत जानकारी, बढ़ा-चढ़ाकर किए गए दावे, या दबाई गई चर्चाएँ रोज़मर्रा में सामने आती रहती हैं
- अगर जानकारी को जानबूझकर और व्यवस्थित ढंग से नहीं चुना जाए, तो ग़लतियों, अतिशयोक्ति और विकृति के संपर्क में आसानी से आने का ख़तरा रहता है
- लेखक ने एक संतुलित सूचना पाइपलाइन बनाकर फ़ायदा पाया है, और इसे शुरुआती लोगों के लिए अच्छा शुरुआती बिंदु मानता है
जानकारी हासिल करने के सामान्य सिद्धांत
- मूल स्रोत के क़रीब की जानकारी को देखना महत्वपूर्ण है
- AI लैब्स की आधिकारिक घोषणाएँ या प्रमुख व्यक्तियों की राय को primary source के रूप में देखना चाहिए
- secondary और tertiary reporting पर निर्भर न रहने का रवैया ज़रूरी है
- भरोसेमंद विशेषज्ञों की टिप्पणियों को सक्रिय रूप से ढूँढकर पढ़ना चाहिए
सुझाए गए शुरुआती स्रोत
-
Simon Willison’s Blog
- Simon Willison’s Blog (AI टैग)
- तकनीकी लोगों के लिए सबसे ज़्यादा सुझाया जाने वाला शुरुआती स्रोत, जो AI frontier, applications, security और ethics issues को व्यापक रूप से कवर करता है
- Django, Datasette के निर्माता के रूप में भी प्रसिद्ध हैं
- उदाहरण: The Lethal Trifecta, LLMs in 2024
-
Andrej Karpathy
- Twitter/X | YouTube
- OpenAI के founding member और Tesla AI के पूर्व director
- AI models की आंतरिक संरचना और सिद्धांत सबसे आसान तरीके से सीखने के लिए बेहतरीन चैनल; साथ ही सांस्कृतिक प्रभाव और AI से होने वाले सामाजिक बदलावों को देखने में भी मददगार
- उदाहरण: Deep Dive into LLMs like ChatGPT, How I Use LLMs
Every’s Chain of Thought
- Every’s Chain of Thought
- Dan Shipper (Every के co-founder) इसे लिखते हैं और AI के व्यावहारिक उपयोग तथा benchmarks से आगे बढ़कर वास्तविक model experience साझा करते हैं
- उदाहरण: Vibe Check: Codex, Vibe Check: o3
आधिकारिक AI लैब सामग्री को मॉनिटर कैसे करें
- OpenAI(News), Google DeepMind(DeepMind), Anthropic(News), Meta AI(Blog), xAI(News), Qwen(Activity) आदि के official blogs, news, model cards, engineering guides, और papers को नियमित रूप से देखें
- उदाहरण: OpenAI o3 आधिकारिक घोषणा, Claude 4 System Card
- engineering blog: Anthropic Engineering, OpenAI Voice Agent Guide, Gemini Cookbook
- paper examples: DeepSeek R1 पेपर, Anthropic Biology पेपर
- छोटी research labs: Nous Research, Allen AI, Prime Intellect, Pleias, Cohere, Goodfire आदि को भी देखना उपयोगी है
ध्यान देने लायक AI विशेषज्ञ और व्यावहारिक engineers
- open source tools बनाने वाले और AI engineering के वास्तविक अनुभव रखने वाले विशेषज्ञों की जानकारी कई बार आधिकारिक guides से अधिक व्यावहारिक मदद देती है
प्रमुख अनुशंसित लोग और ब्लॉग
- Hamel Husain
- Shreya Shankar
- Jason Liu
- Eugene Yan
- What We’ve Learned From A Year of Building with LLMs
- LLM के व्यावहारिक निर्माण-अनुभव रखने वालों द्वारा लिखे गए उपयोग-मामलों का archive
- Chip Huyen
- Omar Khattab (ट्विटर)
- Kwindla Hultman Kramer (ट्विटर)
- Han Chung Lee
- Jo Kristian Bergum
- David Crawshaw
- Alexander Doria / Pierre Carl-Langlais
- Nathan Lambert’s “Interconnects”
- Ethan Mollick
- AI Snake Oil – Arvind Narayanan & Sayash Kapoor
AI news/media और community का उपयोग
-
Twitter/X
- Twitter/X सूची
- AI पर real-time चर्चा और जानकारी हासिल करने का केंद्र, जहाँ तरह-तरह की ख़बरें और बहसें मिलती हैं
- Twitter feed को अख़बार पढ़ने की तरह 15~20 मिनट दें, और ज़रूरत पड़ने पर लोगों व स्रोतों को और फ़ॉलो करें
-
Shawn Wang(swyx) / smol.ai
- swyx ट्विटर | AI News by smol.ai
- Latent Space न्यूज़लेटर
- Twitter के विकल्प के रूप में रोज़ AI रुझानों का सार देते हैं
-
Dwarkesh Patel
AI पर गहन चर्चा/संसाधन communities
- LessWrong (AI Alignment), AI Alignment Forum: AI safety, governance, technical analysis आदि
- यहाँ अक्सर मुख्यधारा, जैसे Twitter, में कम दिखने वाली उच्च-स्तरीय चर्चाएँ मिलती हैं
- उदाहरण: Claude plays Pokémon breakdown, The Waluigi Effect
- Gwern: AI, LLM, transformer आदि पर विश्वकोश-स्तर के गहन लेख
- AI से जुड़े बड़े पैमाने के लेख और LLM scaling जैसी पूर्वानुमानात्मक अंतर्दृष्टि वाले लेख उपलब्ध हैं
- उदाहरण: The Scaling Hypothesis, You could have invented transformers ट्यूटोरियल
- Prompt Whisperers/Latent space explorers
जानकारी हासिल करने के व्यावहारिक तरीके
- सभी स्रोतों को पूरी तरह ट्रैक करना ज़रूरी नहीं; Twitter feed को अख़बार की तरह पढ़ना एक व्यावहारिक तरीका है
- कोई दिलचस्प लेख मिले, तो उसके लेखक को फ़ॉलो करें और उसके दूसरे काम भी देखें — इस तरह विस्तार से पढ़ना भी उपयोगी है
- यह पुराने समय में संगीत खोजने जैसे सूचना-अन्वेषण के तरीक़े से मिलता-जुलता है
- अगर इसे बौद्धिक खोज के आनंद के रूप में लिया जाए, तो यह फ़र्ज़ नहीं बल्कि आनंद बन सकता है
निष्कर्ष और अनुशंसित सूची
- दी गई Twitter/X सूची के ज़रिए ऊपर बताए गए विशेषज्ञों और प्रैक्टिशनर्स को एक साथ फ़ॉलो किया जा सकता है
- जल्द ही RSS फ़ॉर्मेट में सूची भी जोड़ी जाएगी
5 टिप्पणियां
Hacker News राय
मेरा मानना है कि अगर आपको बुनियादी तौर पर समझ है कि LLM कैसे काम करते हैं, तो PR लोगों, ब्लॉगर्स, इंडस्ट्री लीडर्स और इंटरनेट विचारकों की लगातार आती सारी सामग्री को फॉलो करना ज़रूरी नहीं है
बल्कि ऐसे इंटरव्यू और लेखों को लगातार फॉलो करते-करते आप उन अजीब ट्रेंड्स के पीछे भाग सकते हैं जो असल में मददगार नहीं होते
वास्तव में मॉडलों के बीच का फर्क बस कुछ सालों के अंतर जैसा रहा है, कोई बहुत बड़ा मौलिक अंतर नहीं; अभी ज़्यादातर बदलाव tools या integration के काम में हो रहे हैं
यह हमेशा याद रखना चाहिए कि LLM आखिरकार एक "text model" है और बिना किसी आधारभूत समझ के चीज़ें generate करता है; तब आप समझ पाते हैं कि यह कहाँ उपयोगी है और कहाँ नहीं
"मेरी ज़िंदगी में AI सबसे तेज़ विकसित होने वाली तकनीक रही है" — इस दावे से भी मैं व्यक्तिगत रूप से बहुत सहमत नहीं हूँ
मैंने वह दौर देखा है जब SVM उभर रहे थे, जब neural networks को मज़ाक समझा जाता था, और फिर deep learning तथा अलग-अलग DL frameworks के विस्फोटक विस्तार वाले लगभग 10 साल भी देखे हैं
तब भी 10 साल के भीतर बहुत तेज़ प्रगति हुई थी
वेब में भी ऐसा ही बदलाव हुआ था, जहाँ JS सिर्फ UX को बेहतर बनाने का साधन था और फिर single-page apps standard बन गए
असली बात यह है कि अगर आप 'मुख्य influencer list' में नहीं हैं, तो चुपचाप इंतज़ार करना कहीं बेहतर रणनीति है, जब तक चीज़ आपके लिए सचमुच महत्वपूर्ण न हो जाए
मैंने भी backbone.js के दौर के बाद 10 साल तक वेब डेवलपमेंट ट्रेंड्स को लगभग अनदेखा किया, और जब React की ज़रूरत पड़ी तो कुछ दिन पढ़कर तुरंत इस्तेमाल कर लिया
LSTM भी 5 साल पहले ऐसी चीज़ थी जिसे हर कोई implement करना सीखना चाहता था, लेकिन अब transformers की वजह से पुरानी लगती है
अपने पूरे करियर में मैंने यही महसूस किया है कि 'तेज़ी से बदल रहा है' का मतलब अक्सर 'अभी mature नहीं है' होता है
उल्टा, पुराने statistical models (जैसे GLM) और उनके आज भी काम आने वाले practical उपयोगों को सीखना, हर समय चल रहे 'prompt hack' के पीछे भागने से कहीं ज़्यादा productive समाधान देता है
पहली, कोई नया tool जो मौजूदा tools से थोड़ा अलग है या थोड़ा बेहतर performance देता है (अगर उसमें सच में नया feature है तो उपयोगी हो सकता है, लेकिन ज़्यादातर जल्द ही पुराना हो जाता है)
Kimi-K2, GPT 4.1 जैसे नाम भी कुछ महीनों बाद कोई याद न करे, ऐसा हो सकता है
दूसरी, जब सच में मॉडल में कोई नई क्षमता जुड़ती है
जैसे RL(reinforcement learning), chain of thought, सच में काम करने वाले coding agents, बेहद शक्तिशाली multimodal models, या समझदार tool integration
बस ऐसे बड़े leaps पर ध्यान देना काफ़ी है
सच कहें तो 500+ points वाले HN पोस्ट्स पर नज़र डालते रहने से ही मौजूदा रुझान स्वाभाविक रूप से समझ आ जाते हैं
मेरा मानना है कि LLM की असली क्षमताएँ सीखने का सबसे अच्छा तरीका ब्लॉग या वीडियो नहीं, बल्कि खुद बनाना और ठोकर खाकर सीखना है
research का 99% हिस्सा incremental progress होता है (और यह अपने आप में ठीक बात है, इससे निराश होने की ज़रूरत नहीं)
ज़्यादातर papers ज़रूरत से ज़्यादा लंबे होते हैं, और अगर आप ध्यान से पढ़ें तो सिर्फ गणितीय intuition के आधार पर भी काफ़ी कुछ पहले से अनुमान लगाया जा सकता है (idea समझ आ जाए तो result का अंदाज़ा भी लग जाता है)
यह महसूस करना आसान है कि field बहुत तेज़ी से बदल रही है, लेकिन असल में गति इतनी भी तेज़ नहीं होती
मैं भी जब निजी कारणों से 1 साल का विराम लेकर लौटा, तो महसूस किया कि बहुत कुछ बदला ही नहीं था
ऐसी सोच से 'updated बने रहने' के दबाव से बाहर निकला जा सकता है
अगर अभी मुश्किल लग रहा है, तो इसका मतलब यह है कि आपकी expertise अभी थोड़ी कम है, यह नहीं कि आप पीछे छूट गए हैं
जैसे किसी के साथ दौड़ने के लिए पहले खुद दौड़ना आना चाहिए, वैसे ही घबराहट सिर्फ दिमाग के भीतर की चिंता है
असली core algorithm (next token prediction) खुद ज़्यादातर non-experts को उतना नहीं छूता
dot product, embedding जैसी details में लगभग किसी की दिलचस्पी नहीं होती। समझाने पर भी ज़्यादा याद नहीं रहता, और बहुत मदद भी नहीं मिलती
'latest trends' को हर हाल में फॉलो करना ज़रूरी नहीं है; बस हल्की-सी दिलचस्पी बनाए रखें और केवल उन features/techniques को चुनकर आज़माएँ जो सच में आपकी efficiency बढ़ाएँ (किसी ने X पर क्या recommend किया, उस पर मुझे खास भरोसा नहीं)। उल्टा, AI hype को लेकर आलोचनात्मक नज़र रखने वाले researchers से मैंने काफ़ी कुछ सीखा है[https://x.com/burkov]। इस समय बहुत ज़्यादा बढ़ा-चढ़ाकर बातें, बदलाव और अनिश्चितता है। अगर कोई असली breakthrough होगा, तो HN (या mainstream community) में उसके बारे में ज़रूर सुनने को मिलेगा
मुझे लगा कि लेख "क्यों" को ठीक से समझाता नहीं, इसलिए उसकी सूची में दिए गए "कैसे" उतने convincing नहीं लगते। मेरा कीमती समय कहीं और भी बेहतर खर्च हो सकता है
मैं Gergely Orosz का "Pragmatic Engineer" newsletter subscribe करता हूँ (इन दिनों उसमें AI पर बहुत सामग्री होती है), और Gary Marcus का Substack भी देखता हूँ (यह LLM के प्रति थोड़ा अधिक skeptical नज़रिया रखता है)
https://newsletter.pragmaticengineer.com/
https://substack.com/@garymarcus
और मैं Langchain, PydanticAI जैसे Python packages की खबरों पर भी नज़र रखता हूँ (ऐसे projects कुछ हद तक इंडस्ट्री के व्यावहारिक ट्रेंड्स को दिखाते हैं)। मैं अब X(Twitter) इस्तेमाल नहीं करता, लेकिन Simon Willison जैसे लोग BlueSky और Mastodon पर भी कभी-कभी पोस्ट करते हैं। Sebastian Raschka, Chip Huyen वगैरह LinkedIn पर भी लिखते हैं। चीज़ें इधर-उधर बिखरी हुई हैं, लेकिन अंततः ज़रूरी खबरें ज़्यादातर कहीं-न-कहीं मिल ही जाती हैं
हो सकता है मैं कुछ महत्वपूर्ण चीज़ें मिस कर रहा हूँ, लेकिन जो updates सच में core और meaningful होते हैं, वे स्वाभाविक रूप से HN के main page या comments में दिखाई दे ही जाते हैं
अगर आप मुख्य रूप से LLM और frontier AI models की खबरें फॉलो करना चाहते हैं, तो यह recommendation list बहुत बढ़िया है; इसमें आधे से ज़्यादा लोग ऐसे हैं जिन्हें मैंने खुद भी अलग से खोजा था
मैं X(Twitter) पर AI accounts की एक list बनाकर follow करता हूँ, और कुल मिलाकर वही सबसे मज़बूत information source है
कुछ ब्लॉग और podcast RSS भी उपयोगी हैं (अगर आप researcher हैं, तो papers का RSS तो अनिवार्य है)
मैं जिन चीज़ों को जोड़ूँगा, वे हैं https://epoch.ai, podcasts में Dwarkesh Patel, blogs में Peter Wildeford, @omarsar0(DAIR elvis), और अलग-अलग researchers को सीधे follow करना (हालाँकि उनमें से कुछ जानकारी से ज़्यादा मनोरंजन के लिए होते हैं)
इस field का information environment बुरी तरह polluted है। खासकर अगर आप सिर्फ NYT जैसे ऐसे media को follow करते हैं जो इसे मुख्यतः political angle से कवर करते हैं, तो आपको और भी biased और inaccurate तस्वीर मिलेगी
ध्यान रहे कि generative AI से सीधे जुड़ी नहीं होने वाली ML fields (जैसे protein, genomics, weather models, diffusion/image generation research आदि) के information sources बिल्कुल अलग होते हैं
AI/ML श्रेणी इतनी व्यापक है कि सब कुछ एक साथ पकड़ना असंभव है
क्या इसे फॉलो करना ज़रूरी है? नहीं, ऐसा नहीं है
ज़्यादातर लोग यह सिर्फ नई तकनीक और latest trends के प्रति जिज्ञासा के कारण करते हैं
फिर भी, software development जैसे क्षेत्रों में AI को पूरी तरह अनदेखा करना मध्यम और लंबी अवधि में career के लिए ख़तरनाक हो सकता है (सिर्फ tools को इस्तेमाल करना सीख लेना भी पर्याप्त हो सकता है)
मैं अपने काम की प्रकृति के कारण, जिसमें overall दिशा को समझना ज़रूरी है, लगातार इसे track करता रहता हूँ
Simon Willison का ब्लॉग ही अपने आप में नई और high-quality जानकारी सीखने के लिए काफ़ी है (noise लगभग नहीं के बराबर है और signal-to-noise ratio बेहतरीन है)
'trends' के पीछे भागना ज़रूरी नहीं
tech jobs लगातार कम होंगी, और किसी बिंदु पर तेज़ी से घटेंगी भी (AI 10 लोगों का काम 1 व्यक्ति से करवा देगा, और बाद में white-collar, blue-collar — जैसे Amazon warehouse robots से जुड़े काम — पर भी यही असर पड़ेगा)
मैंने तो इस हफ्ते व्यक्तिगत रूप से GPT Plus subscription cancel कर दिया; अब उस 'राक्षस' को और नहीं पालना चाहता
map support (जैसे travel routes, दोस्तों के साथ loop rides आदि) जैसी सुविधाओं में Gemini का free version मुझे उल्टा बेहतर लगा
अगर आप बस पहली recommendation मान लें (simow का ब्लॉग पढ़ें), तो आम तौर पर इतना ही काफ़ी है
Andrej Karpathy के lectures से मुझे बहुत मदद मिली है
वे YouTube पर भी उपलब्ध हैं(https://www.youtube.com/@AndrejKarpathy)
मैं ऐसी भूमिका में था जहाँ मुझे machine learning researchers को mentor और मदद करनी होती थी, लेकिन Andrej की आवाज़ सुनते ही मुझे लगता है जैसे मैं कुछ भी न जानने वाला छात्र हूँ
शुरुआत में यह अजीब लगा, लेकिन अब वही विनम्रता मुझे बहुत कीमती संपत्ति लगती है
सच में 'मैं कुछ नहीं जानता' वाली भावना बहुत महत्वपूर्ण है
सिसकी... बहुत पढ़ने लायक नहीं है
अगर आपको यह पढ़ने में मुश्किल लग रहा है, तो शायद समस्या मुख्य लेख में नहीं है।
सहमत हूँ
इस समय के लिए बेहद ज़रूरी एक तरह की लेखन शैली।