29 पॉइंट द्वारा GN⁺ 2025-06-19 | 2 टिप्पणियां | WhatsApp पर शेयर करें
  • "Software is Changing (Again)"
  • software paradigm 70 साल में पहली बार मूल रूप से बदल रहा है, और पिछले कुछ वर्षों में यह Software 1.0 (पारंपरिक code), 2.0 (neural network weights), 3.0 (LLM और natural language prompts) तक तेज़ी से विकसित हुआ है
  • LLM अब सिर्फ एक साधारण tool नहीं, बल्कि एक नए Operating System जैसी software ecosystem के रूप में स्थापित हो रहा है, और ऐसा युग खुल रहा है जहाँ कोई भी English जैसी natural language में computer को program कर सकता है
  • AI tools·agents के साथ collaboration, और 'partial autonomy' भविष्य के software products का core बन रहे हैं, और विश्वसनीयता के लिए इसके साथ इंसानी तेज़ verification और control ज़रूरी है
  • AI और LLM में 'people spirits' जैसी विशेषताएँ हैं — विशाल memory और knowledge क्षमता के साथ-साथ hallucination, context loss, security risk जैसी अपनी सीमाएँ भी हैं
  • आगे चलकर software·documentation·infrastructure को 'agent-friendly (LLMs-friendly)' रूप में फिर से design करना होगा, ताकि LLM उन्हें आसानी से समझ सकें और उन पर action ले सकें

Software 1.0 → 2.0 → 3.0 : paradigm का विकास

  • Software 1.0: इंसानों द्वारा सीधे लिखा गया पारंपरिक source code
  • Software 2.0: neural network के weights (parameters) को dataset और optimizer से tune करके बनाया गया model
  • Software 3.0: Large Language Model (LLM) आधारित, English जैसी natural language prompts से program (commands) बनाना
  • हाल में GitHub पर code, English और code के मिश्रित रूप में विकसित हो रहा है, और programming language के रूप में English तेज़ी से फैल रही है
  • Hugging Face आदि Software 2.0 के लिए 'GitHub' जैसी भूमिका निभा रहे हैं और open source model ecosystem को आगे बढ़ा रहे हैं

LLM एक नया Operating System (OS) है

  • LLM अब साधारण API·utility से आगे बढ़कर ऐसे platform में विकसित हो रहा है जिस पर Operating System की तरह तरह-तरह के software चलें
  • फिलहाल इसका उपयोग 1960s के mainframe युग की तरह cloud-केंद्रित centralized structure में हो रहा है
  • लंबी अवधि में personal LLM युग (distributed·local उपयोग) आने की संभावना का भी उल्लेख है
  • LLM उपयोग का environment पारंपरिक terminal·command-line interface जैसा है, लेकिन अभी universal GUI पर्याप्त विकसित नहीं है

LLM की क्षमताएँ और सीमाएँ

  • LLM के पास विशाल memory और knowledge acquisition capability है, लेकिन hallucination (गलत जानकारी), context memory loss, security vulnerability जैसी अंतर्निहित खामियाँ भी मौजूद हैं
  • LLM का 'working memory' इंसानों को स्पष्ट रूप से manage करना पड़ता है, और long-term context learning अभी भी कमज़ोर है
  • security·prompt injection जैसे व्यावहारिक risk factors मौजूद हैं, इसलिए उपयोग करते समय सावधानी ज़रूरी है

Partial Autonomy और human-LLM collaboration

  • Cursor, Perplexity जैसे LLM-आधारित apps पारंपरिक manual operation और LLM automation के संयोजन के रूप में विकसित हो रहे हैं, जहाँ 'autonomy slider' की अवधारणा है (user control और AI delegation के स्तर को समायोजित करना)
  • GUI के माध्यम से audit और तेज़ verification loop, और 'AI को छोटे दायरे में बाँधकर control करने की methodology' practical work में अनिवार्य है
  • अनुमान है कि software, product, service — सभी में क्रमशः 'partial automation' और autonomy बढ़ती जाएगी

वास्तविक उदाहरण और 'Vibecoding' culture

  • 'Vibecoding' culture फैल रही है, जहाँ कोई भी English में सीधे LLM के ज़रिए app बना सकता है
  • Karpathy ने भी coding अनुभव न होने वाली language (Swift) में सिर्फ एक दिन में iOS app बनाकर उसे वास्तविक service तक बढ़ाने का अनुभव साझा किया
  • prototype development LLM से आसान हो जाता है, लेकिन वास्तविक serviceization (authentication, payment, deployment आदि) अभी भी manual work और DevOps का bottleneck है
  • आगे का मुख्य काम यह है कि जहाँ अभी इंसानों को खुद click और setting करनी पड़ती है, वहाँ 'agents' उनकी जगह ले सकें, और इसके लिए 'agent-friendly software/documentation' design ज़रूरी है

documentation·infrastructure में बदलाव और agent-friendliness

  • मौजूदा human-centric documentation (click, क्रम आदि) को LLM·agents सीधे उपयोग नहीं कर पाते, इसलिए उसे Markdown·command-आधारित रूप में फिर से बनाना होगा
  • Versell, Stripe आदि agent-friendly documentation transition (जैसे curl commands) शुरू कर चुके हैं
  • अलग-अलग tools (GitHub Ingest, DeepWiki आदि) code repository और documentation को ऐसे रूप में बदलते हैं जिसे LLM सीधे इस्तेमाल कर सकें

निष्कर्ष और आगे की दिशा

  • यह अभी बहुत सारा code नया लिखने और rewrite करने का सबसे अच्छा समय है
  • LLM एक 'supportive tool (Iron Man suit)' के रूप में human developers के साथ collaborate करेगा, और full autonomy की ओर gradual innovation चलता रहेगा
  • आने वाले 10 सालों में 'autonomy slider' को चरणबद्ध तरीके से ऊपर ले जाना मुख्य trend होगा
  • developers और organizations को LLM·agents के लिए optimized software·documentation·infrastructure redesign में तेजी लानी चाहिए

2 टिप्पणियां

 
laeyoung 2025-06-24

यह वीडियो कमाल का है! इसमें Andrew Ng के "AI Is the New Electricity" वाले कथन का ज़िक्र करते हुए बताया गया है कि 80 करोड़ लोग जिस ChatGPT का इस्तेमाल करते हैं, अगर वह डाउन हो जाए, तो वह बिजली चले जाने जैसा है — यह बात सच में बहुत असर करती है।

 
GN⁺ 2025-06-19
Hacker News राय
  • यह प्रतिक्रिया साझा की गई कि Karpathy की उपमाएँ और वास्तविकता को सटीक रूप से देखने का उनका नज़रिया वास्तव में बहुत अच्छा है
  • यह राय दी गई कि पारंपरिक coding, neural network weights, और prompts की समानांतर तुलना दिलचस्प है; उदाहरण के लिए, autonomous driving modules में सीधे लिखे गए code की जगह ऐसे dataset के अनुरूप neural network को optimize करने का तरीका, जो target को अच्छी तरह represent करे, वास्तव में काफ़ी उपयोगी हो सकता है। लेकिन यह भी ज़ोर देकर कहा गया कि कई environments में hardware constraints के कारण "software 2.0" या "software 3.0" की application scope बहुत सीमित रहेगी। यह दृष्टिकोण भी साझा किया गया कि मौजूदा code और prompts एक-दूसरे के पूरक tools के रूप में बने रहेंगे, और इनमें से कोई एक भी अकेले पूर्ण समाधान नहीं होगा
  • Karpathy की इस बात के लिए प्रशंसा की गई कि वे हमेशा स्पष्ट रूप से सोचने वाले व्यक्ति हैं, और उनकी उपमाएँ प्रभावशाली बताई गईं। यह जिज्ञासा भी व्यक्त की गई कि Waymo 2013 में ही बिना रुकावट autonomous driving करने में सक्षम था, तो फिर वह इतनी जल्दी scale क्यों नहीं कर पाया—क्या इसकी वजह regulation थी, या driving optimization की कठिनाई? यह भी उल्लेख किया गया कि एक slide पर ‘AGI 2027’ लिखा हुआ था, और ai-2027.com का ज़िक्र किया गया
  • यह संक्षिप्त प्रतिक्रिया दी गई कि प्रस्तुति उम्मीद से कहीं ज़्यादा जल्दी आ जाने से आश्चर्य हुआ
  • टॉक पुरानी पड़ने से पहले इसे साझा करने के लिए YC को धन्यवाद दिया गया, साथ ही संबंधित ट्वीट लिंक भी दिया गया(https://x.com/karpathy/status/1935077692258558443)