- लेखक बताते हैं कि उन्होंने 10 साल से अधिक समय तक LLM और text generation तकनीकों पर शोध किया है, लेकिन उम्मीद के विपरीत वे रोज़मर्रा की ज़िंदगी में LLM का अक्सर उपयोग नहीं करते
- LLM इस्तेमाल करते समय वे prompt engineering, system prompt सेट करना, temperature control जैसी बारीक नियंत्रण प्रक्रियाओं को अहम मानते हैं, और सामान्य frontend की बजाय API-आधारित तरीके को पसंद करते हैं
- data labeling, article cluster summary, style guide review जैसे BuzzFeed के कामों में उन्होंने ठोस समस्या-समाधान के लिए LLM का उपयोग किया और बड़े स्तर पर समय की बचत साबित की
- वे लेखन के लिए LLM का उपयोग नहीं करते, लेकिन काल्पनिक Hacker News comments के ज़रिए आलोचनात्मक नज़रिये की जांच करने के तरीके से लेख की तर्क-संगति परखने में इसका उपयोग करते हैं
- LLM coding assistance में उपयोगी है, लेकिन जटिल या उच्च विश्वसनीयता वाले कामों के लिए वे खुद implementation करना पसंद करते हैं, और agents व vibe coding को लेकर संदेहपूर्ण रुख बनाए रखते हैं
मेरे और LLM के बीच की दूरी
- लेखक लंबे समय से RNN-आधारित text generation, GPT-2 tuning, GPT-3/ChatGPT experiments आदि में generative AI tools का गहरा अनुभव रखने वाले data scientist हैं
- लेकिन वे इन्हें सीधे तौर पर बार-बार इस्तेमाल कम ही करते हैं, और उपयोग करना है या नहीं यह काम की प्रकृति और ज़रूरत के आधार पर लिया गया एक व्यावहारिक tool-based निर्णय होता है
LLM को नियंत्रित करने का तरीका
- prompt engineering के ज़रिए मनचाहा output निकालना LLM उपयोग का मुख्य हिस्सा है
- सामान्य frontend (ChatGPT.com) की बजाय वे सीधे API call करते हैं या backend UI के माध्यम से उपयोग करते हैं, खासकर Claude Sonnet API को पसंद करते हैं
- system prompt और temperature control के माध्यम से creativity और determinism के बीच संतुलन बनाया जाता है; आम तौर पर
0.0 ~ 0.3 पर सेट करके output की predictability सुनिश्चित की जाती है
- hallucination की समस्या (तथ्यहीन सामग्री बनाना) temperature बढ़ने पर अधिक गंभीर हो जाती है, इसलिए सावधानी ज़रूरी है
काम में उपयोग के उदाहरण
- BuzzFeed article classification automation: Claude API, JSON-आधारित classification scheme, और
temperature 0.0 सेटिंग के साथ सटीक category assignment किया गया
- article cluster summary: 5 मिलते-जुलते लेख देकर साझा शीर्षक और विवरण लौटवाना, जिससे कुशल cluster summarization automation संभव हुई
- punctuation और style guide review: पूरी style guide को system prompt में डालकर policy-आधारित grammar judgment कराया गया
- हर काम में कुछ घंटों के भीतर POC पूरा किया जा सकता था, और पुरानी विधियों की तुलना में कई दिनों से अधिक समय की बचत साबित हुई
लिखना खुद, आलोचना LLM से
- ब्लॉग post वे खुद लिखते हैं, क्योंकि उनके writing style में ऐसी विशिष्टता है जिसे LLM दोहराना मुश्किल है
- लेकिन वे LLM से Hacker News user की तरह आलोचनात्मक comments लिखने को कहते हैं, ताकि तार्किक कमज़ोरियों को खोजने वाले tool के रूप में इसका उपयोग हो सके
- यह तरीका लेख की गुणवत्ता बेहतर बनाने में मदद करता है, लेकिन LLM लेखन का विकल्प नहीं है
coding में LLM का उपयोग
- regular expression लिखना, Pillow image compositing जैसे जटिल लेकिन दोहराव वाले कामों में LLM productivity को काफी बढ़ाता है
- दूसरी ओर Polars जैसी नई libraries के साथ LLM कभी-कभी pandas functions समझ बैठता है, जिससे समस्याएँ पैदा होती हैं
- Copilot जैसे real-time code suggestions उन्हें पसंद नहीं, क्योंकि लगातार mental context switching से ध्यान भंग होता है
- LLM द्वारा सुझाए गए विचारों में वे "idea उधार लो + खुद सुधारो" वाले दृष्टिकोण को बेहतर मानते हैं
Agents, MCP, Vibe Coding पर राय
- MCP और Agents वैचारिक रूप से बेहतर हुए हैं, लेकिन व्यावहारिक रूप से कोई नया use case नहीं दे पाए हैं
- Vibe Coding शौकिया projects के लिए उपयोगी हो सकती है, लेकिन औपचारिक products के लिए उपयुक्त नहीं है, और इसे जिम्मेदारी से बचने के साधन की तरह इस्तेमाल नहीं करना चाहिए
- वे इस बात पर ज़ोर देते हैं कि सिर्फ भरोसेमंद code ही पेशेवर होने की पहचान है
LLM उद्योग और नैतिकता पर विचार
- "LLM बेकार है" जैसा दावा वास्तविक उपयोग की दुनिया को नहीं दर्शाता; असली मुद्दा short-term ROI और industry structure है
- open source models और वैकल्पिक infrastructure (Cerebras, Groq आदि) OpenAI के न रहने पर भी LLM की मांग पूरी कर सकते हैं
- अंततः LLM एक ऐसा tool है जिसे उद्देश्य के मुताबिक ठीक तरह से इस्तेमाल करना चाहिए, और अंधी प्रशंसा भी, अंधा विरोध भी—दोनों खतरनाक हैं
समापन
- LLM एक ऐसा tool है जो गोल छेद में चौकोर कील ठूंसने जैसा भी हो सकता है—यानी यह अकार्यक्षम भी हो सकता है और क्रांतिकारी भी
- महत्वपूर्ण बात है यह तय करने की तकनीकी समझ कि इसे कब, कहाँ और कैसे इस्तेमाल करना है; LLM युग में यही असली क्षमता है
2 टिप्पणियां
मैं आख़िरी पंक्ति से पूरी तरह सहमत हूँ। साथ ही, मुझे भी कुछ ऐसा ही महसूस हुआ था—आख़िरकार AI और LLM उतने ही उपयोगी और काम में लाने योग्य होते हैं, जितनी उपयोगकर्ता की अपनी क्षमता होती है।
Hacker News राय
अनुभवी प्रोग्रामर जब LLMs के साथ काम करते हैं तो उन्हें होने वाली उलझन भरी बातों पर राय दी गई है
UI या वेबसाइट के mock बनाने के लिए vibe coding का उपयोग किया जाता है
LLMs से सबसे अच्छे नतीजे पाने के लिए कई तरह के तरीके आज़माए गए हैं
कम लोकप्रिय libraries पर जटिल code सवालों में LLM के output को लेकर अधिक सावधानी बरती जाती है
नई library की documentation या पूरा codebase सीधे long-context model में paste करने का तरीका इस्तेमाल किया जाता है
लेखक ने chat logs शामिल किए, यह बात अच्छी लगी
ChatGPT.com या सामान्य user interface का उपयोग नहीं किया जाता
आधुनिक LLM interfaces, जहाँ system prompt को स्पष्ट रूप से सेट नहीं किया जा सकता, अपना खुद का system prompt इस्तेमाल करते हैं
generated text पर खास constraints सेट करना, user prompt की तुलना में system prompt में अधिक प्रभावी होता है
हर LLM service के backend UI का उपयोग किया जाता है
JSON responses हमेशा उम्मीद के मुताबिक काम नहीं करते
LLM का उपयोग नई चीज़ें सीखने या छोटे scripts लिखने के लिए किया जाता है