2 पॉइंट द्वारा GN⁺ 7 시간 전 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • LLM कीबोर्ड या कार की तरह शरीर में रच-बस जाने वाला अच्छा टूल नहीं है; वह अनुरोध और मोलभाव मांगने वाले किसी पक्ष की तरह काम करता है, जिससे यूज़र की सामाजिक ऊर्जा खर्च होती है
  • अच्छे टूल में consistency और speed की वजह से दिमाग उन्हें शरीर के विस्तार की तरह स्वीकार कर लेता है, लेकिन Claude या Cursor जैसे LLM अभी उस स्तर तक नहीं पहुंचे हैं
  • LLM यूज़र को लोगों से बात करने की तरह अनुरोध करना, मनाना और कभी-कभी गुस्सा करना पड़ता है, यानी वे सामाजिक लागत चुकाते हैं
  • लोगों के साथ interaction सीखने, चुनौती, प्रेरणा और प्रतिवाद जैसे rewards देता है, लेकिन LLM आम तौर पर ज्यादा code और tests, बहाने, और कभी-कभी bug reports लौटाते हैं
  • कुछ काम अब उस स्तर तक संभव हो गए हैं जिन्हें एक साल पहले अकेले एक व्यक्ति के लिए करना मुश्किल था, लेकिन हर काम में सामाजिक ऊर्जा LLM पर खर्च करना, उसे असली सहकर्मी पर खर्च करने से बेहतर है या नहीं, यह अनिश्चित है

टूल नहीं, बातचीत का साथी बनते LLM

  • LLM को चलाने के लिए सामाजिक ऊर्जा चाहिए होती है, इसलिए वे थकान पैदा करते हैं
  • यह ऊर्जा असली लोगों के साथ interaction में लगाना शायद बेहतर हो सकता है
  • अच्छे टूल का इस्तेमाल करते समय दिमाग टूल को शरीर के हिस्से की तरह स्वीकार कर लेता है
    • कार चलाना
    • कीबोर्ड पर टाइप करना
    • Vim या VSCode में key combinations दबाकर काम करना
  • इसके उलट, जब हम किसी व्यक्ति से बात करते हैं तो हम सामाजिक चेतना की प्रक्रिया में शामिल होते हैं
    • बातचीत करना
    • मदद मांगना
    • ticket को अगले quarter में टालने से बचाने के लिए सहयोग करना
  • यह सामाजिक दिमागी काम साधारण टूल इस्तेमाल करने से कठिन है और ज्यादा ऊर्जा मांगता है

LLM जो लौटाते हैं और जिन rewards की कमी है

  • LLM कीबोर्ड या कार की तरह टूल का जादू नहीं दे पाते
    • बहुत कम लोग कहेंगे कि Claude या Cursor शरीर के विस्तार जैसा महसूस होता है
    • consistency और speed पर्याप्त नहीं हैं, इसलिए दिमाग के लिए उन्हें टूल की तरह स्वीकार करना मुश्किल है
  • इसके बजाय यूज़र LLM से बातचीत करने, मोलभाव करने, मनाने और कभी-कभी गुस्सा होने का सामाजिक टैक्स चुकाते हैं
  • लोगों पर सामाजिक लागत खर्च करना मूल्यवान है, क्योंकि उससे ज्यादा rewards मिलते हैं
    • कुछ नया सीख सकते हैं या चुनौती पा सकते हैं
    • प्रेरणा मिल सकती है
    • अगर आप बकवास करें तो सामने वाला मना कर सकता है
    • उल्टा, आप दूसरों को सिखा सकते हैं, उन्हें चुनौती दे सकते हैं या प्रेरित कर सकते हैं
  • LLM ज्यादातर ज्यादा code, ज्यादा tests और ज्यादा बहाने लौटाते हैं
    • कभी-कभी वे ज्यादा bug reports भी देते हैं, जो मूल्यवान है
  • कुछ कामों में LLM की वजह से एक व्यक्ति वे चीजें कर सकता है जो एक साल पहले संभव नहीं थीं
  • लेकिन हर काम में LLM से बातचीत पर सामाजिक दिमागी काम खर्च करना उचित है या नहीं, यह स्पष्ट नहीं है
  • LLM यूज़र से कहते हैं कि उनसे बात की जाए, लेकिन उस मेहनत के बराबर reward वे शायद ही कभी देते हैं

1 टिप्पणियां

 
GN⁺ 7 시간 전
Lobste.rs की राय
  • मेरे मामले में AI से बात करना पहले ही दूसरी प्रकृति जैसा बन चुका है। अब मैं तरह-तरह के सवालों के लिए दिन में लगभग 10 चैट खोल लेता हूँ, और यह लगभग बिना सोचे-समझे हो जाता है
    सवाल डालना, पढ़ना, जवाब देना, फिर दोबारा पढ़ना — यह पूरा प्रवाह Google पर खोज करने जैसा लगता है। जैसे ड्राइविंग में हाथ अपने-आप चलने लगते हैं, वैसे ही AI से बात करना भी कम-से-कम मेरे लिए उसी जगह को लेने लगा है

    • मैं भी कुछ ऐसा ही इस्तेमाल करता हूँ, लेकिन इन दिनों Brave search को धीरे-धीरे और ज़्यादा साथ में इस्तेमाल कर रहा हूँ। लगता है कि अगर LLM पर बहुत ज़्यादा निर्भर हो जाएँ, तो लंबे समय में रिसर्च करने की क्षमता कमजोर पड़ सकती है
      क्योंकि वह स्रोत ढूँढने और ज्ञान को जोड़ने का बहुत सारा काम हमारी जगह कर देता है। बेशक, जब जल्दी कोई कम-ज़रूरी जवाब चाहिए हो तो यह ठीक है, लेकिन कुल मिलाकर मुझे लगता है कि अपनी रिसर्च क्षमता को तेज बनाए रखना चाहिए
    • मैंने सामान्य vibe coding flow में इसे शामिल नहीं किया था। सहमत हूँ। मैं भी Google search की तरह चैट खोलकर कुछ ढूँढता हूँ, और अगर सवाल छोटे रखे जाएँ और लंबी back-and-forth बातचीत शुरू न की जाए, तो यह काफ़ी हल्का लगता है
      जब कोई खास सवाल होता है तो मैं codebase से भी पूछता हूँ, लेकिन वह मेरे लिए किसी सहकर्मी से पूछने के ज़्यादा करीब है। क्योंकि उसमें अभिव्यक्ति पर सोचना पड़ता है, कभी-कभी और ठोस तरीके से फिर पूछना पड़ता है, और कभी झूठा जवाब मिल जाए तो बात को फिर से कहना पड़ता है
    • यह देखते हुए कि LLM अक्सर hallucination करते हैं, मुझे नहीं लगता कि यह अच्छी बात है। याद है मैंने कोई रिसर्च देखी थी जिसमें कहा गया था कि LLM के जवाबों का लगभग आधा हिस्सा सही नहीं होता, और नहीं लगता कि वह आँकड़ा बाद में बहुत बेहतर हुआ होगा
      इस्तेमाल के तरीके पर निर्भर करते हुए यह सोचने का काम लगभग पूरी तरह उस पर छोड़ देने जैसा हो सकता है, इसलिए क्षमता-ह्रास का जोखिम भी है। LLM पर ज़्यादा निर्भर होने के बजाय कम निर्भर होने की कोशिश करनी चाहिए
  • “इनाम” की बात करें तो, कुछ दिन पहले मैंने एक दिलचस्प बात देखी। मैं दो जूनियर प्रोग्रामरों के साथ काम कर रहा हूँ, और मेरे लिए यह काफ़ी कठिन संतुलन है। मुझे लोगों का हौसला बढ़ाना पसंद है, लेकिन जूनियर्स को कोच करते समय उनके काम का आलोचनात्मक मूल्यांकन भी करना पड़ता है
    इसलिए मैं तारीफ़ का मौका ढूँढता हूँ, लेकिन जब मैं उनके उस काम की समीक्षा करता हूँ जो उन्होंने LLM पर टिककर बनाया है, तो महसूस होता है कि LLM मुझसे वह मौका छीन लेता है जिसमें मैं उनकी सराहना कर सकता था और उन्हें बढ़ने में मदद कर सकता था। यह अलग करना मुश्किल हो जाता है कि कौन-सा हिस्सा generated है और कौन-सा हिस्सा सच में उन्होंने खुद सीखकर किया है
    आख़िर में मैं उस काम की आलोचना करते हुए, जो LLM ने किया है, “LLM से यह ज़्यादा करवाओ / कम करवाओ” जैसी बात कहने लगता हूँ, या सामने वाला रक्षात्मक होकर कहता है, “लेकिन LLM ने तो ऐसा कहा था।” सच कहूँ तो इससे code review की value पर ही दोबारा सोचने का मन होता है। जब हर किसी के पास अपना वर्चुअल “coding buddy” हो, तो लगता है code review के ज़रिए ज्ञान साझा करने के मौके कम हो गए हैं

    • जब LLM बीच में हो तो approach को सच में बदलना पड़ता है। अब review के दो स्तर हैं। असली code change, और उस change को बनाने के लिए tool का इस्तेमाल कैसे किया गया
      दोनों ही feedback देने योग्य क्षेत्र हैं, लेकिन दूसरे क्षेत्र में अभी तक विशेषज्ञ नहीं हैं, इसलिए वह ज़्यादा collaborative लगता है। फिर भी पहला नियम साफ़ है। अगर कोई “LLM ने ऐसा कहा” से आगे बढ़कर change का कारण और उसकी सामग्री समझा नहीं सकता, तो उसे reject करके दोबारा करना चाहिए
  • मैं इस बात से सहमत हूँ कि LLM को लगातार हाँकते रहना थकाऊ होता है, लेकिन इसकी तुलना driving से नहीं की जा सकती। मुझे क़ानूनी तौर पर गाड़ी चलाते हुए 30 साल से ज़्यादा हो गए हैं, लेकिन अगर मुझे पूरे काम के घंटों में लगातार ड्राइव करना पड़े, तो शायद अगले दिन छुट्टी चाहिए होगी
    वहाँ सिर्फ अपनी गलती की चिंता नहीं होती, बल्कि दूसरे ड्राइवरों की लापरवाही और अयोग्यता के कारण जान का ख़तरा भी हो सकता है। आप कहाँ ड्राइव कर रहे हैं, इससे भी फ़र्क पड़ता होगा 😅

    • मुझे लगता है कि यह कार user experience की usability से कम, और उस user experience को चलाते समय होने वाले घातक परिणामों तथा आपके आसपास उन्हीं कामों में लगे अजनबियों की मौजूदगी से ज़्यादा जुड़ी बात है
  • लेखक की tool की परिभाषा मानें तो मेरे लिए Firefox शायद tool कहलाने लायक ही नहीं, और उस मानक पर Chromium सक्रिय रूप से दुर्भावनापूर्ण और शत्रुतापूर्ण है
    LLM के आसपास mental energy बचने/खर्च होने की चर्चा मुझे बेहद बहु-आयामी लगती है। इसमें यह भी आता है कि कोई व्यक्ति इंसान-जैसी चैट की ओर तुरंत कितना खिंचता है बनाम ऐसी चीज़ की ओर जिसका कोई स्थायी मन नहीं है, और उसके ऊपर अंतर्मुखी/द्विमुखी/बहिर्मुखी स्वभाव भी जुड़ जाता है। यह भी मायने रखता है कि किसी की सोच रैखिक भाषा के कितनी करीब है या कितनी दूर; इसलिए LLM सोचने की जगह लेने वाली चीज़ भी हो सकता है, या असली सोच को चिढ़ाने वाली मानवीय संचार-परंपराओं में अनुवाद करने के काम की जगह लेने वाली चीज़ भी। पढ़ने की गति और टाइपिंग की गति का फ़र्क भी है
    लेख में जिस सामाजिक persona और back-and-forth बातचीत की बात है, उसके बारे में कहूँ तो मैं लोगों को अच्छी तरह पढ़ नहीं पाता और लोगों को rewind भी नहीं कर सकता, इसलिए LLM से कुछ करवाना मेरे लिए मानवीय बातचीत जैसा बिल्कुल नहीं है। जवाब से पहले उसके लंबे हिस्से को देखकर मैं समझ सकता हूँ कि मेरी पंक्ति की अस्पष्टता को कैसे समझा गया, और बातचीत के पहले हिस्से को बनाए रखते हुए आख़िरी request को फिर से लिखकर गलत व्याख्या से बच सकता हूँ। बाद के जवाब को guide करने के लिए history में LLM के अपने जवाब को भी फिर से लिख सकता हूँ
    हो सकता है hosted LLM सुरक्षा से जुड़ी सोच को पूरी तरह फिर से लिखवाने के मामले में कम उत्साही हों, लेकिन वह भी local model ही इस्तेमाल करने की एक और वजह है। hosted oligopoly service होना, बिना चेतावनी व्यवहार बदल देना, और hidden weights — ये सब ही बचने के लिए काफ़ी कारण हैं
    बेशक, ऐसा manipulation अगर इंसानों के साथ किया जाए तो बुरी बात है। इंसान लंबे समय तक बने रहने वाले व्यक्तित्व होते हैं। इसलिए ऐसे tool से बात करना, जिसे स्थायी मन रखने के लिए बनाया ही नहीं गया, कभी-कभी कम थकाऊ होता है। अगर मैं बहुत छोटा और दफ़्तरी अंदाज़ में बोलूँ, तो tool बुरा नहीं मानता
    और क्या अभी की सलाह यही नहीं है कि मानवीय बातचीत की तरह संदर्भ में गलती छोड़कर बाद में सफ़ाई देने से बेहतर, लगभग हमेशा initial query को फिर से लिखकर गलती से बचा जाए?

  • मुझे Claude से बात करना अच्छा लगता है, और उसे human preference के हिसाब से बहुत ही अनुकूल ढंग से train किया गया है, इसलिए मुझे लगता है कि बहुत-से लोग ऐसा ही महसूस करेंगे