87 पॉइंट द्वारा GN⁺ 2025-07-21 | 5 टिप्पणियां | WhatsApp पर शेयर करें
  • Generative AI सबसे तेज़ी से विकसित होने वाली तकनीक है, इसलिए इसे कम आँकना और ज़्यादा आँकना — दोनों ही ख़तरनाक हैं
  • विश्वसनीय स्रोतों और भरोसेमंद विशेषज्ञों को लगातार फ़ॉलो करना ज़रूरी है
  • Simon Willison’s Blog, Andrej Karpathy, Every’s Chain of Thought जैसे संतुलित सूचना पाइपलाइन की सिफारिश की गई है
  • आधिकारिक AI लैब घोषणाएँ, engineering blogs, papers तकनीक की वास्तविक प्रगति और सीमाओं को समझने के लिए अनिवार्य हैं
  • Twitter/X, news curation, expert lists जैसे कई चैनलों से ताज़ा रुझानों और गहन विश्लेषण — दोनों तक पहुँचा जा सकता है

परिचय: AI को लेकर ग़लतफ़हमियाँ और सूचना प्रदूषण

  • Generative AI लेखक के जीवनकाल की सबसे तेज़ी से आगे बढ़ने वाली तकनीक है
  • लेकिन AI को लेकर ग़लतफ़हमियाँ भी बहुत फैली हुई हैं, और समूचा सूचना-पर्यावरण काफ़ी अव्यवस्थित है
  • ऐसे कई वास्तविक मामले सामने आते हैं जहाँ कंपनियाँ, सरकारें या लोग, जो संबंधित तकनीक को पर्याप्त रूप से नहीं समझते, उसका दुरुपयोग करते हैं या गंभीर नुकसान पहुँचाते हैं
  • AI को कम आँकने (“जल्द ख़त्म हो जाने वाला ट्रेंड”) और ज़्यादा आँकने (“अब programmers की ज़रूरत नहीं रहेगी”) जैसी दोनों ध्रुवों वाली ग़लतफ़हमियाँ मौजूद हैं
  • तकनीक की सही समझ की कमी ही इन ग़लतफ़हमियों की जड़ है

AI जानकारी हासिल करने का तरीका

  • AI से जुड़ी जानकारी को सही तरह समझना, जितना लगता है उससे ज़्यादा मुश्किल है
  • यह ऐसा माहौल है जहाँ विकृत जानकारी, बढ़ा-चढ़ाकर किए गए दावे, या दबाई गई चर्चाएँ रोज़मर्रा में सामने आती रहती हैं
  • अगर जानकारी को जानबूझकर और व्यवस्थित ढंग से नहीं चुना जाए, तो ग़लतियों, अतिशयोक्ति और विकृति के संपर्क में आसानी से आने का ख़तरा रहता है
  • लेखक ने एक संतुलित सूचना पाइपलाइन बनाकर फ़ायदा पाया है, और इसे शुरुआती लोगों के लिए अच्छा शुरुआती बिंदु मानता है

जानकारी हासिल करने के सामान्य सिद्धांत

  • मूल स्रोत के क़रीब की जानकारी को देखना महत्वपूर्ण है
    • AI लैब्स की आधिकारिक घोषणाएँ या प्रमुख व्यक्तियों की राय को primary source के रूप में देखना चाहिए
    • secondary और tertiary reporting पर निर्भर न रहने का रवैया ज़रूरी है
  • भरोसेमंद विशेषज्ञों की टिप्पणियों को सक्रिय रूप से ढूँढकर पढ़ना चाहिए

सुझाए गए शुरुआती स्रोत

  • Simon Willison’s Blog

    • Simon Willison’s Blog (AI टैग)
    • तकनीकी लोगों के लिए सबसे ज़्यादा सुझाया जाने वाला शुरुआती स्रोत, जो AI frontier, applications, security और ethics issues को व्यापक रूप से कवर करता है
    • Django, Datasette के निर्माता के रूप में भी प्रसिद्ध हैं
    • उदाहरण: The Lethal Trifecta, LLMs in 2024
  • Andrej Karpathy

    • Twitter/X | YouTube
    • OpenAI के founding member और Tesla AI के पूर्व director
    • AI models की आंतरिक संरचना और सिद्धांत सबसे आसान तरीके से सीखने के लिए बेहतरीन चैनल; साथ ही सांस्कृतिक प्रभाव और AI से होने वाले सामाजिक बदलावों को देखने में भी मददगार
    • उदाहरण: Deep Dive into LLMs like ChatGPT, How I Use LLMs

Every’s Chain of Thought

  • Every’s Chain of Thought
  • Dan Shipper (Every के co-founder) इसे लिखते हैं और AI के व्यावहारिक उपयोग तथा benchmarks से आगे बढ़कर वास्तविक model experience साझा करते हैं
  • उदाहरण: Vibe Check: Codex, Vibe Check: o3

आधिकारिक AI लैब सामग्री को मॉनिटर कैसे करें

ध्यान देने लायक AI विशेषज्ञ और व्यावहारिक engineers

  • open source tools बनाने वाले और AI engineering के वास्तविक अनुभव रखने वाले विशेषज्ञों की जानकारी कई बार आधिकारिक guides से अधिक व्यावहारिक मदद देती है

प्रमुख अनुशंसित लोग और ब्लॉग

AI news/media और community का उपयोग

  • Twitter/X

    • Twitter/X सूची
    • AI पर real-time चर्चा और जानकारी हासिल करने का केंद्र, जहाँ तरह-तरह की ख़बरें और बहसें मिलती हैं
      • Twitter feed को अख़बार पढ़ने की तरह 15~20 मिनट दें, और ज़रूरत पड़ने पर लोगों व स्रोतों को और फ़ॉलो करें
  • Shawn Wang(swyx) / smol.ai

  • Dwarkesh Patel

AI पर गहन चर्चा/संसाधन communities

जानकारी हासिल करने के व्यावहारिक तरीके

  • सभी स्रोतों को पूरी तरह ट्रैक करना ज़रूरी नहीं; Twitter feed को अख़बार की तरह पढ़ना एक व्यावहारिक तरीका है
  • कोई दिलचस्प लेख मिले, तो उसके लेखक को फ़ॉलो करें और उसके दूसरे काम भी देखें — इस तरह विस्तार से पढ़ना भी उपयोगी है
  • यह पुराने समय में संगीत खोजने जैसे सूचना-अन्वेषण के तरीक़े से मिलता-जुलता है
  • अगर इसे बौद्धिक खोज के आनंद के रूप में लिया जाए, तो यह फ़र्ज़ नहीं बल्कि आनंद बन सकता है

निष्कर्ष और अनुशंसित सूची

  • दी गई Twitter/X सूची के ज़रिए ऊपर बताए गए विशेषज्ञों और प्रैक्टिशनर्स को एक साथ फ़ॉलो किया जा सकता है
  • जल्द ही RSS फ़ॉर्मेट में सूची भी जोड़ी जाएगी

ट्विटर सूची पर जाएँ

5 टिप्पणियां

 
GN⁺ 2025-07-21
Hacker News राय
  • मेरा मानना है कि अगर आपको बुनियादी तौर पर समझ है कि LLM कैसे काम करते हैं, तो PR लोगों, ब्लॉगर्स, इंडस्ट्री लीडर्स और इंटरनेट विचारकों की लगातार आती सारी सामग्री को फॉलो करना ज़रूरी नहीं है
    बल्कि ऐसे इंटरव्यू और लेखों को लगातार फॉलो करते-करते आप उन अजीब ट्रेंड्स के पीछे भाग सकते हैं जो असल में मददगार नहीं होते
    वास्तव में मॉडलों के बीच का फर्क बस कुछ सालों के अंतर जैसा रहा है, कोई बहुत बड़ा मौलिक अंतर नहीं; अभी ज़्यादातर बदलाव tools या integration के काम में हो रहे हैं
    यह हमेशा याद रखना चाहिए कि LLM आखिरकार एक "text model" है और बिना किसी आधारभूत समझ के चीज़ें generate करता है; तब आप समझ पाते हैं कि यह कहाँ उपयोगी है और कहाँ नहीं

    • मैं इस राय से सचमुच सहमत हूँ; उस ब्लॉग की 'high signal' सूची भी मुझे काफी हद तक self-promotion करने वाले लोगों की सूची लगी (हालाँकि कुछ लोग अच्छे भी हैं), यानी insight से ज़्यादा 'buzz' जैसा माहौल
      "मेरी ज़िंदगी में AI सबसे तेज़ विकसित होने वाली तकनीक रही है" — इस दावे से भी मैं व्यक्तिगत रूप से बहुत सहमत नहीं हूँ
      मैंने वह दौर देखा है जब SVM उभर रहे थे, जब neural networks को मज़ाक समझा जाता था, और फिर deep learning तथा अलग-अलग DL frameworks के विस्फोटक विस्तार वाले लगभग 10 साल भी देखे हैं
      तब भी 10 साल के भीतर बहुत तेज़ प्रगति हुई थी
      वेब में भी ऐसा ही बदलाव हुआ था, जहाँ JS सिर्फ UX को बेहतर बनाने का साधन था और फिर single-page apps standard बन गए
      असली बात यह है कि अगर आप 'मुख्य influencer list' में नहीं हैं, तो चुपचाप इंतज़ार करना कहीं बेहतर रणनीति है, जब तक चीज़ आपके लिए सचमुच महत्वपूर्ण न हो जाए
      मैंने भी backbone.js के दौर के बाद 10 साल तक वेब डेवलपमेंट ट्रेंड्स को लगभग अनदेखा किया, और जब React की ज़रूरत पड़ी तो कुछ दिन पढ़कर तुरंत इस्तेमाल कर लिया
      LSTM भी 5 साल पहले ऐसी चीज़ थी जिसे हर कोई implement करना सीखना चाहता था, लेकिन अब transformers की वजह से पुरानी लगती है
      अपने पूरे करियर में मैंने यही महसूस किया है कि 'तेज़ी से बदल रहा है' का मतलब अक्सर 'अभी mature नहीं है' होता है
      उल्टा, पुराने statistical models (जैसे GLM) और उनके आज भी काम आने वाले practical उपयोगों को सीखना, हर समय चल रहे 'prompt hack' के पीछे भागने से कहीं ज़्यादा productive समाधान देता है
    • अगर LLM architecture की कुछ समझ हो, तो LLM से जुड़ी ज़्यादातर नई खबरें दो तरह की होती हैं
      पहली, कोई नया tool जो मौजूदा tools से थोड़ा अलग है या थोड़ा बेहतर performance देता है (अगर उसमें सच में नया feature है तो उपयोगी हो सकता है, लेकिन ज़्यादातर जल्द ही पुराना हो जाता है)
      Kimi-K2, GPT 4.1 जैसे नाम भी कुछ महीनों बाद कोई याद न करे, ऐसा हो सकता है
      दूसरी, जब सच में मॉडल में कोई नई क्षमता जुड़ती है
      जैसे RL(reinforcement learning), chain of thought, सच में काम करने वाले coding agents, बेहद शक्तिशाली multimodal models, या समझदार tool integration
      बस ऐसे बड़े leaps पर ध्यान देना काफ़ी है
      सच कहें तो 500+ points वाले HN पोस्ट्स पर नज़र डालते रहने से ही मौजूदा रुझान स्वाभाविक रूप से समझ आ जाते हैं
      मेरा मानना है कि LLM की असली क्षमताएँ सीखने का सबसे अच्छा तरीका ब्लॉग या वीडियो नहीं, बल्कि खुद बनाना और ठोकर खाकर सीखना है
    • पूरी तरह सहमत। मैं छात्रों से हमेशा यही कहता हूँ
      • 1. दूसरों के अनुभव में ज़रूरत से ज़्यादा मत उलझो, अपने प्रत्यक्ष अनुभव पर ध्यान दो
      • 2. ब्लॉग पढ़ने से बेहतर है खुद app बनाकर देखो
      • 3. हर व्यक्ति का अनुभव बहुत अलग होता है, इसलिए दूसरों की राय ज्यों-का-त्यों मत अपनाओ
      • 4. Twitter या Substack पर researchers और developers के पीछे बिना सोचे-समझे मत भागो (ज़्यादातर लोग अपना showcase कर रहे होते हैं)
      • 5. चिंता और FOMO में समय बर्बाद मत करो; खुद करके सीखो। जो बदलाव सच में महत्वपूर्ण होंगे, उनके बारे में वैसे भी बाद में पता चल ही जाएगा
      • 6. जानकारी होना ज़रूरी है, लेकिन जानकारी के प्रति जुनूनी मत बनो। अपना समय समझदारी से बाँटो। मैं छात्रों से हमेशा इस बात पर ज़ोर देता हूँ
    • सच कहें तो research की दुनिया में भी यही बात लागू होती है
      research का 99% हिस्सा incremental progress होता है (और यह अपने आप में ठीक बात है, इससे निराश होने की ज़रूरत नहीं)
      ज़्यादातर papers ज़रूरत से ज़्यादा लंबे होते हैं, और अगर आप ध्यान से पढ़ें तो सिर्फ गणितीय intuition के आधार पर भी काफ़ी कुछ पहले से अनुमान लगाया जा सकता है (idea समझ आ जाए तो result का अंदाज़ा भी लग जाता है)
      यह महसूस करना आसान है कि field बहुत तेज़ी से बदल रही है, लेकिन असल में गति इतनी भी तेज़ नहीं होती
      मैं भी जब निजी कारणों से 1 साल का विराम लेकर लौटा, तो महसूस किया कि बहुत कुछ बदला ही नहीं था
      ऐसी सोच से 'updated बने रहने' के दबाव से बाहर निकला जा सकता है
      अगर अभी मुश्किल लग रहा है, तो इसका मतलब यह है कि आपकी expertise अभी थोड़ी कम है, यह नहीं कि आप पीछे छूट गए हैं
      जैसे किसी के साथ दौड़ने के लिए पहले खुद दौड़ना आना चाहिए, वैसे ही घबराहट सिर्फ दिमाग के भीतर की चिंता है
    • जब मैं LLM समझाता हूँ, तो लोग architecture से ज़्यादा इस बात में दिलचस्पी लेते हैं कि यह 'token-by-token prediction (autoregression)' करता है और हमेशा सबसे अधिक probability वाले token को नहीं चुनता, बल्कि probability के अनुपात में sample करता है
      असली core algorithm (next token prediction) खुद ज़्यादातर non-experts को उतना नहीं छूता
      dot product, embedding जैसी details में लगभग किसी की दिलचस्पी नहीं होती। समझाने पर भी ज़्यादा याद नहीं रहता, और बहुत मदद भी नहीं मिलती
  • 'latest trends' को हर हाल में फॉलो करना ज़रूरी नहीं है; बस हल्की-सी दिलचस्पी बनाए रखें और केवल उन features/techniques को चुनकर आज़माएँ जो सच में आपकी efficiency बढ़ाएँ (किसी ने X पर क्या recommend किया, उस पर मुझे खास भरोसा नहीं)। उल्टा, AI hype को लेकर आलोचनात्मक नज़र रखने वाले researchers से मैंने काफ़ी कुछ सीखा है[https://x.com/burkov]। इस समय बहुत ज़्यादा बढ़ा-चढ़ाकर बातें, बदलाव और अनिश्चितता है। अगर कोई असली breakthrough होगा, तो HN (या mainstream community) में उसके बारे में ज़रूर सुनने को मिलेगा

    • खुद कुछ घंटों तक इस्तेमाल करके देखना, कई घंटों तक सामग्री पढ़ने से कहीं ज़्यादा मूल्यवान सीख है
  • मुझे लगा कि लेख "क्यों" को ठीक से समझाता नहीं, इसलिए उसकी सूची में दिए गए "कैसे" उतने convincing नहीं लगते। मेरा कीमती समय कहीं और भी बेहतर खर्च हो सकता है

    • सच में यह सवाल उठता है कि क्या किसी चीज़ को 'लगातार फॉलो' करना भी ज़रूरी है। जो innovation वास्तव में मायने रखती है, वह अंततः mainstream हो जाती है और मेरे पास भी स्वाभाविक रूप से पहुँच जाती है। Excel या Google Docs में भी मेरी शुरुआत में ज़्यादा रुचि नहीं थी, फिर भी mainstream होने के बाद मैंने उन्हें आराम से सीखकर अच्छी तरह इस्तेमाल किया। जब तक कोई साफ़ वजह न हो कि तुरंत पीछे भागना ही पड़े — जैसे किसी AI startup की runway बहुत कम बची हो — तब तक घबराने की ज़रूरत नहीं
  • मैं Gergely Orosz का "Pragmatic Engineer" newsletter subscribe करता हूँ (इन दिनों उसमें AI पर बहुत सामग्री होती है), और Gary Marcus का Substack भी देखता हूँ (यह LLM के प्रति थोड़ा अधिक skeptical नज़रिया रखता है)
    https://newsletter.pragmaticengineer.com/
    https://substack.com/@garymarcus
    और मैं Langchain, PydanticAI जैसे Python packages की खबरों पर भी नज़र रखता हूँ (ऐसे projects कुछ हद तक इंडस्ट्री के व्यावहारिक ट्रेंड्स को दिखाते हैं)। मैं अब X(Twitter) इस्तेमाल नहीं करता, लेकिन Simon Willison जैसे लोग BlueSky और Mastodon पर भी कभी-कभी पोस्ट करते हैं। Sebastian Raschka, Chip Huyen वगैरह LinkedIn पर भी लिखते हैं। चीज़ें इधर-उधर बिखरी हुई हैं, लेकिन अंततः ज़रूरी खबरें ज़्यादातर कहीं-न-कहीं मिल ही जाती हैं

  • हो सकता है मैं कुछ महत्वपूर्ण चीज़ें मिस कर रहा हूँ, लेकिन जो updates सच में core और meaningful होते हैं, वे स्वाभाविक रूप से HN के main page या comments में दिखाई दे ही जाते हैं

    • इंडस्ट्री ट्रेंड्स के पीछे भागना 140 किमी/घंटा की treadmill पर चढ़कर दौड़ने जैसा है। मैंने तो दौड़ने की कोशिश ही छोड़ दी है। मैं मानता हूँ कि AI (खासतौर पर LLM) कोई अस्थायी फैशन नहीं है, लेकिन अभी बदलाव बहुत ज़्यादा हैं। जब तक सच में ज़रूरत न पड़े, मैं इसमें लंबा समय निवेश नहीं करूँगा। उम्मीद है कुछ सालों में इंडस्ट्री का परिदृश्य और साफ़ हो जाएगा। और अगर नहीं भी हुआ, तब भी मैं उन ट्रेंड्स पर समय बर्बाद करने से बच जाऊँगा जो जल्दी ही बेकार हो सकते हैं। फिलहाल मैं अपने असली काम में AI या LLM का बिल्कुल इस्तेमाल नहीं कर रहा हूँ
    • कंपनियाँ जब इतना बड़ा निवेश और R&D कर रही हैं, तो वे अपनी तकनीक छिपाने की बजाय उल्टा उसे खुलकर दिखाने की प्रवृत्ति रखती हैं
    • IT की पूरी दुनिया के ट्रेंड्स के साथ भी मैं यही रवैया रखता हूँ
  • अगर आप मुख्य रूप से LLM और frontier AI models की खबरें फॉलो करना चाहते हैं, तो यह recommendation list बहुत बढ़िया है; इसमें आधे से ज़्यादा लोग ऐसे हैं जिन्हें मैंने खुद भी अलग से खोजा था
    मैं X(Twitter) पर AI accounts की एक list बनाकर follow करता हूँ, और कुल मिलाकर वही सबसे मज़बूत information source है
    कुछ ब्लॉग और podcast RSS भी उपयोगी हैं (अगर आप researcher हैं, तो papers का RSS तो अनिवार्य है)
    मैं जिन चीज़ों को जोड़ूँगा, वे हैं https://epoch.ai, podcasts में Dwarkesh Patel, blogs में Peter Wildeford, @omarsar0(DAIR elvis), और अलग-अलग researchers को सीधे follow करना (हालाँकि उनमें से कुछ जानकारी से ज़्यादा मनोरंजन के लिए होते हैं)
    इस field का information environment बुरी तरह polluted है। खासकर अगर आप सिर्फ NYT जैसे ऐसे media को follow करते हैं जो इसे मुख्यतः political angle से कवर करते हैं, तो आपको और भी biased और inaccurate तस्वीर मिलेगी
    ध्यान रहे कि generative AI से सीधे जुड़ी नहीं होने वाली ML fields (जैसे protein, genomics, weather models, diffusion/image generation research आदि) के information sources बिल्कुल अलग होते हैं
    AI/ML श्रेणी इतनी व्यापक है कि सब कुछ एक साथ पकड़ना असंभव है
    क्या इसे फॉलो करना ज़रूरी है? नहीं, ऐसा नहीं है
    ज़्यादातर लोग यह सिर्फ नई तकनीक और latest trends के प्रति जिज्ञासा के कारण करते हैं
    फिर भी, software development जैसे क्षेत्रों में AI को पूरी तरह अनदेखा करना मध्यम और लंबी अवधि में career के लिए ख़तरनाक हो सकता है (सिर्फ tools को इस्तेमाल करना सीख लेना भी पर्याप्त हो सकता है)
    मैं अपने काम की प्रकृति के कारण, जिसमें overall दिशा को समझना ज़रूरी है, लगातार इसे track करता रहता हूँ

  • Simon Willison का ब्लॉग ही अपने आप में नई और high-quality जानकारी सीखने के लिए काफ़ी है (noise लगभग नहीं के बराबर है और signal-to-noise ratio बेहतरीन है)

    • अगर आप Simon को GitHub पर sponsor करते हैं ($10 या उससे ज़्यादा), तो ईमेल से "कम मात्रा वाला मुख्य summary" भी मिल सकता है

      "पिछले एक महीने में LLM क्षेत्र की सबसे महत्वपूर्ण प्रगतियों का सार (10 मिनट से कम में पढ़ा जा सकने वाला)"
      https://simonwillison.net/about/

    • https://simonwillison.net
    • अच्छी बात यह है कि वहाँ RSS feed भी है, इसलिए code और news दोनों देखे जा सकते हैं
  • 'trends' के पीछे भागना ज़रूरी नहीं

    • सही है, अब छोड़कर कुछ और करने का समय है
    • सच तो यह है कि tech industry छोड़कर नया career बनाना भी एक तरीका हो सकता है
      tech jobs लगातार कम होंगी, और किसी बिंदु पर तेज़ी से घटेंगी भी (AI 10 लोगों का काम 1 व्यक्ति से करवा देगा, और बाद में white-collar, blue-collar — जैसे Amazon warehouse robots से जुड़े काम — पर भी यही असर पड़ेगा)
      मैंने तो इस हफ्ते व्यक्तिगत रूप से GPT Plus subscription cancel कर दिया; अब उस 'राक्षस' को और नहीं पालना चाहता
      map support (जैसे travel routes, दोस्तों के साथ loop rides आदि) जैसी सुविधाओं में Gemini का free version मुझे उल्टा बेहतर लगा
  • अगर आप बस पहली recommendation मान लें (simow का ब्लॉग पढ़ें), तो आम तौर पर इतना ही काफ़ी है

    • वह भी मेरे लिए ज़्यादा मेहनत है, इसलिए मैं सुबह की कॉफी के साथ Fireship के videos देख लेता हूँ
    • ज़ोरदार recommendation — लगभग बिना clickbait के बहुत उच्च गुणवत्ता वाले summaries
  • Andrej Karpathy के lectures से मुझे बहुत मदद मिली है
    वे YouTube पर भी उपलब्ध हैं(https://www.youtube.com/@AndrejKarpathy)
    मैं ऐसी भूमिका में था जहाँ मुझे machine learning researchers को mentor और मदद करनी होती थी, लेकिन Andrej की आवाज़ सुनते ही मुझे लगता है जैसे मैं कुछ भी न जानने वाला छात्र हूँ
    शुरुआत में यह अजीब लगा, लेकिन अब वही विनम्रता मुझे बहुत कीमती संपत्ति लगती है
    सच में 'मैं कुछ नहीं जानता' वाली भावना बहुत महत्वपूर्ण है

 
makers 2025-07-22

सिसकी... बहुत पढ़ने लायक नहीं है

 
reagea0 2025-07-23

अगर आपको यह पढ़ने में मुश्किल लग रहा है, तो शायद समस्या मुख्य लेख में नहीं है।

 
harris 2025-07-28

सहमत हूँ

 
supermaxi 2025-07-22

इस समय के लिए बेहद ज़रूरी एक तरह की लेखन शैली।