UIUX का परिदृश्य बदलने के लिए शायद प्लेटफ़ॉर्म को भी फोन या मॉनिटर जैसे form factor से बाहर निकलने की कोशिश करनी होगी।

 

कोडिंग एजेंट्स के साथ सबसे अच्छी तरह मेल खाने वाली programming language कौन-सी है?
मैं एक backend developer हूँ जो मुख्य रूप से मौजूदा Java & Kotlin, Spring का इस्तेमाल करता रहा है, इसलिए Cursor इस्तेमाल करते समय कई बार थोड़ा घुटन-सा महसूस होता है..

 

मैं अभी एक पुराने React ऐप को Astro में रिफैक्टर कर रहा हूँ.
लेख में "इंटीग्रेटेड कॉन्टेक्स्ट" पर ज़ोर दिया गया है। "इंटीग्रेटेड कॉन्टेक्स्ट" तेज़ी से सर्विस बनाने में मदद करता है, लेकिन यह समझना चाहिए कि कभी न कभी यह तकनीकी कर्ज़ बन सकता है।
सर्विस के दीर्घकालिक मेंटेनेंस के नज़रिए से, "इंटीग्रेटेड टाइट कपलिंग" की तुलना में "स्वतंत्र मॉड्यूल्स की लूज़ कपलिंग" बेहतर है।
और Astro इसके लिए सबसे लचीला framework है।

 

https://x.com/karpathy/status/1917920257257459899
Andrej Karpathy की राय से भी एक बार तुलना करके देखना अच्छा रहेगा।

LLM के साथ 'chat' करने का अनुभव मानो 80 के दशक के computer terminal का उपयोग करने जैसा है। GUI (graphical user interface) अभी तक आविष्कृत नहीं हुआ है, लेकिन मुझे लगता है कि उसकी कुछ विशेषताओं का अनुमान अभी से लगाया जा सकता है।

यह visual होगा (पुराने GUI की तरह)। क्योंकि visual information (तस्वीरें, charts, animations आदि — पढ़ने की तुलना में देखने वाली चीज़ें) दिमाग में जाने वाले 10-लेन हाईवे जैसी होती हैं। Vision के पास सबसे अधिक information input bandwidth होती है, और दिमाग की computation का लगभग 1/3 हिस्सा visual processing के लिए आवंटित होता है।

यह generative होगा और input conditions के अनुसार बदलता रहेगा। यानी GUI उपयोगकर्ता के prompt के हिसाब से real time में generate होगा, और उसके सभी elements उसी तत्काल उद्देश्य के लिए मौजूद होंगे और उसी के अनुसार व्यवस्थित किए जाएंगे।

थोड़ा अधिक open question इसका 'procedural' स्वभाव किस हद तक होगा, यह है। एक छोर पर हम यह कल्पना कर सकते हैं कि एक बहुत बड़ा diffusion model पूरे output canvas को एक साथ बना दे, और दूसरे छोर पर (procedurally generated) React components से भरा एक page हो (जैसे: images, charts, animations, diagrams आदि)। मुझे लगता है कि यह दोनों का मिश्रण होगा, लेकिन दूसरा वाला उसका बुनियादी ढांचा बनेगा।

लेकिन मैं अभी यह कह सकता हूँ कि जैसे-जैसे क्षमता लगभग अनंत के करीब जाएगी, fluid, magical, और ephemeral interactive 2D canvas GUI उसका अंतिम रूप होगा। और मेरा मानना है कि यह पहले ही धीरे-धीरे शुरू हो चुका है (जैसे: code block/highlighting, LaTeX blocks, Markdown का bold/italic/list/table, emoji, और अधिक महत्वाकांक्षी रूप में Artifacts tab, Mermaid charts या उससे भी अधिक पूर्ण apps आदि)। बेशक, अभी यह सब बहुत शुरुआती और आदिम स्तर पर है।

Iron Man, और कुछ हद तक Star Trek/Minority Report, इस दिशा को दिखाने वाले लोकप्रिय संस्कृति में AI/UI के अच्छे उदाहरण कहे जा सकते हैं।

 

क्या Cline पेड था? क्या यह फ्री नहीं है?

 

हार्डवेयर-केंद्रित software-defined वाहन

 

सहमत
वैसे भी MBA में जाकर case studies ही करते हैं
आखिर किसी भी चीज़ की desk पर अपनी सीमाएँ होती हैं

 

बोटॉक्स, हाहा, इसका क्या मतलब है, यह समझने के लिए मुझे काफी देर तक पढ़ना पड़ा, हाहा।
मज़ेदार है।
जल्दी ही ऐसा दौर आएगा जब सीमाएँ मायने नहीं रखेंगी।

 

अगर LLM खुद system prompt बदल सकता है, तो उसकी policy के rules भी इंसानों को ही तय करने होंगे, और आखिर में शायद सिर्फ़ रोबोट के 3 नियम जैसी चीज़ें ही बचेंगी।

 

Anthropic, Claude को चलाने वाले "system prompt" का खुलासा

सीधे सार्वजनिक किया गया system prompt आकार में छोटा है। लगता है कि tool से जुड़ा हिस्सा इसमें शामिल नहीं है।

 

वेबपेज लिंक अटैच करना, YouTube लिंक अटैच करना—सब संभव है, और सारांश भी टेक्स्ट में आता है। सोर्स जोड़ने वाला हिस्सा देखिए।
प्रॉम्प्ट के ज़रिए अनुरोध भी किया जा सकता है.

 

सोचता हूँ, HackerNews पर तो कभी-कभी चला जाता हूँ, लेकिन ऐसा लगे बहुत लंबा समय हो गया है जब से TechCrunch पर सीधे जाना ही बंद हो गया है।

 

typst एक ऐसा सॉफ़्टवेयर है जिसका कई बार परिचय कराया गया है, लेकिन यह नहीं पता था कि इसे ऐसे काम के लिए भी इस्तेमाल किया जा सकता है.

LaTeX: अगर Docker Image में चलाया जाए, तो typst जैसी गति नहीं मिलती.
Google Docs: उम्मीद के विपरीत, एडिटिंग उतनी लचीली नहीं है

इन दो बातों को ध्यान में रखें तो यह एक नया विकल्प लगता है.

 

मैंने neovim में Cursor-स्तर के auto-completion में मदद करने वाला कोई plugin है क्या, यह बहुत खोजा था, लेकिन पता चला कि यह एक खुद के मॉडल से संभव था..

 

मैं रोज़ाना Cline with Antrophic (या QWEN) और Github Copilot Code Completion का उपयोग करता हूँ। अगर Cline में सिर्फ Code Completion (टैब कंप्लीशन) फीचर ठीक से काम करने लगे, तो शायद Copilot इस्तेमाल करने की कोई वजह नहीं बचेगी। मैं Copilot के Agent से पहले ही Plan&Act का आदी हो गया था, इसलिए Agent का ज़्यादा इस्तेमाल नहीं किया, लेकिन अब जानबूझकर उसे इस्तेमाल करके तुलना कर रहा हूँ। Cline की एक और बड़ी खूबी यह है कि इसमें अलग-अलग LLMs भी इस्तेमाल किए जा सकते हैं.

संदर्भ: https://x.com/addyosmani/status/1886316192136310838

 

इसके अलावा, अगर यह दिन में एक बार बंद हो जाए तो CloudType, Node के साथ सच में बहुत हल्का सर्वर बनाना हो तो Cafe24 (महीने के 500 वॉन), और static site deployment के लिए Netlify, Cloudflare वगैरह भी हैं 🙇‍♂️