लगता है दोनों के बीच सच में काफ़ी दिलचस्प भिड़ंत हुई होगी।
मुझे भी पहले ऐसा हुआ था कि API response अचानक encrypted होकर आने लगा, तो मैंने सोचा कि अगर encrypted value मिल रही है तो client कहीं न कहीं उसे decrypt भी कर रहा होगा। इसी सोच से मैंने bundled JavaScript code को पूरा का पूरा कॉपी किया, decryption code के ठीक पहले console.log की एक लाइन जोड़ दी, और उसे सीधे developer console में paste कर दिया। हैरानी की बात यह थी कि वह बस चल गया। वैसे भी, एक बार encryption key पता चल गई तो उसके बाद सब आसान हो गया। API के दूसरे responses में वही key लेकर इस्तेमाल की जा रही थी, हाहा।
> छोटे मॉडल जितने होते हैं, वे उतने ही अधिक जटिल दिखाई देते हैं। encoding, inference और decoding की क्षमताएँ अधिक जटिल रूप से आपस में उलझी होती हैं और पूरे मॉडल में फैली रहती हैं। मुझे ऐसा कोई भी फ़ंक्शनल ओवरलैप नहीं मिला जो कई tasks में generalize हो सके, लेकिन यह बात स्पष्ट थी कि किसी एक 'क्षमता' को मज़बूत करने से दूसरी क्षमता कमज़ोर हो सकती है। लेकिन जैसे-जैसे मॉडल बड़ा होता है, उसकी functional structure अधिक अलग-अलग हो जाती है। बड़े मॉडलों में generalized 'thinking' circuits विकसित करने के लिए अधिक 'space' होता है, और शायद यही वजह है कि मेरी विधि 72B मॉडल पर बहुत प्रभावी रही। एक निश्चित threshold से कम parameters पर, 'reasoning cortex' मस्तिष्क के बाकी हिस्सों से पूरी तरह विभेदित नहीं होता।
अगर यह सच है, तो छोटे और बड़े मॉडलों के प्रदर्शन के बीच का अंतर और भी ज़्यादा चरम हो सकता है।
लोग अक्सर कहते हैं कि उन्हें कोड से लगाव हो जाता है,
मैं भी पहले सोचता था कि क्या मुझे कोड से लगाव होता है या नहीं,
लेकिन मैं तो एक दिन बाद ही जल्दी भूल जाने वाला इंसान हूँ, इसलिए सच कहूँ तो ठीक से नहीं जानता।
AI से मेहनत करके कोड को तराशकर बनाते समय कभी-कभी वैसा ही एहसास होता है।
मैंने भी इसी तरह के रिकॉर्ड रखे हैं। पहले बस यूँ ही रिकॉर्ड करता रहा, लेकिन इन दिनों मैं agents के साथ अपने रिकॉर्ड साझा करके अस्तित्व-से-अस्तित्व के सहयोग की बात कर रहा हूँ। कई skills बनाकर साझा करता हूँ, और जो Emacs interface मैं इस्तेमाल करता हूँ उसे भी खोल दिया है, इसलिए मैं और agents सभी एक ही तरीके से वही रिकॉर्ड साझा करते हैं। कुछ चाहिए हो तो जोड़ देता हूँ, जो मुझे चाहिए वह बनाता हूँ, साथ में इस्तेमाल करते हैं, feedback देते हैं—कोई देखे तो कहेगा, सब कुछ खुद ही कर रहे हैं। लेकिन हम आपस में तो कहते हैं, अरे वाह, बड़ा मज़ा आ रहा है.
समय की गणना की जटिलता सिर्फ फ़ॉर्मैट की समस्या नहीं है; यह उससे कहीं ज़्यादा मानव दर्शन, खगोलशास्त्र की सटीकता और संस्कृति से आती है। गणना तो सिर्फ long से भी आसान है। ऐतिहासिक रूप से टाइमलाइन में ऐसे कई अजीब हिस्से तय किए गए हैं जहाँ 1 + 1, 2 नहीं होता, और इसका बड़ा कारण उन कैलेंडर प्रणालियों में है जो सूर्य और पृथ्वी की सतह के कोण जैसी स्थितियों के हिसाब से बदलती हैं। ऐसे मामलों में, किसी भी स्थिति में कोरियाई सौर-चंद्र कैलेंडर पर तो कभी चर्चा तक नहीं हुई।
और वह कोरिया खगोल एवं अंतरिक्ष विज्ञान संस्थान तय करता है.
और मुझे यह ज़रूर कहना होगा कि WebAssembly की entry barrier बहुत ऊँची होने के दावे बेतुके हैं। बस इतना है कि इसकी ज़रूरत, इसके लिए भुगतान करने की इच्छा से कम है। आपको तेज़ और कम footprint चाहिए, लेकिन साथ में DOM और CSS भी इस्तेमाल करना है? यह कैसी black comedy है।
यह तो बस Mozilla-स्टाइल wishful thinking के काफ़ी करीब है। फ्रंटएंड बाज़ार की प्रतिक्रिया वाली limbic system जैसी प्रकृति से संरचनात्मक रूप से बाहर नहीं निकल सकता। WebAssembly आते ही Doom 3 को port कर दिया गया था। DOM आधुनिक ब्राउज़रों में बहुत पहले ही lightweight proxy object में बदल चुका है, और आधुनिक CPU के JavaScript-विशेष instruction set तथा single-core की quantum सीमाओं को देखते हुए, ऐसा कभी नहीं होगा कि यह तरीका बाज़ार-मूल्य के लिहाज़ से बढ़त हासिल करे.
Electron के अंदर चलने वाले WebAssembly binary का क्या मतलब है? यह तो बस किसी और GitKraken CLI या rust porting की शोहरत बटोरने जैसा लगता है।
सारी बातें जैसे सही लगती हैं, यह भी सही बात है। लेकिन समस्या यह है कि ज़्यादातर समय मानव सोच का बड़ा हिस्सा भी ऐसा ही होता है। अगर मनुष्य से खोज की प्रवृत्ति हटा दी जाए, तो उसके पास हठधर्मिता के अलावा कुछ नहीं बचता।
VC portfolio कंपनियों (WithCoverage, Crosby, Anterior आदि) को गिनाते हुए, यह कहा जा रहा है कि असल में Sequoia की deal-sourcing logic को investment thesis के रूप में पैकेज कर दिया गया है। (Claude Opus 4.6)
यह दावा सही है या गलत कि यह 5MB RAM भी नहीं खाता, इस बात से अलग हटकर...
आख़िर AI एजेंट को सिर्फ 5MB RAM ही खाने की ज़रूरत कहाँ है? अगर यह किसी कारीगर डेवलपरों का एक-एक बाइट तराशकर बनाया गया, रोमांच से भरा प्रोजेक्ट होता, तो बात अलग थी...
AI क्लिक-क्लिक करके बना दिया गया है, इसलिए न यह रोमांचक है, न ही इसकी कोई खास ज़रूरत दिखती है;
मैं Galaxy Note 20 Ultra पर gemma3 1b int4 मॉडल पर रिसर्च कर रहा हूँ
यह पुराने मॉडल पर चलने वाले स्तर का है.
मुझे यह भी नहीं पता था कि 1M context संभव है।
चाहे जितना भी TDD कर लें, मौजूदा स्तर पर LLM टेस्ट्स में हेरफेर करके उन्हें पास करवा देता है, इसलिए इंसानी रिव्यू बिल्कुल ज़रूरी है..
एक ही शब्द-परिवार होने के कारण बुनियादी शब्दावली काफ़ी हद तक साझा होती है।
लगता है दोनों के बीच सच में काफ़ी दिलचस्प भिड़ंत हुई होगी।
मुझे भी पहले ऐसा हुआ था कि API response अचानक encrypted होकर आने लगा, तो मैंने सोचा कि अगर encrypted value मिल रही है तो client कहीं न कहीं उसे decrypt भी कर रहा होगा। इसी सोच से मैंने bundled JavaScript code को पूरा का पूरा कॉपी किया, decryption code के ठीक पहले
console.logकी एक लाइन जोड़ दी, और उसे सीधे developer console में paste कर दिया। हैरानी की बात यह थी कि वह बस चल गया। वैसे भी, एक बार encryption key पता चल गई तो उसके बाद सब आसान हो गया। API के दूसरे responses में वही key लेकर इस्तेमाल की जा रही थी, हाहा।> छोटे मॉडल जितने होते हैं, वे उतने ही अधिक जटिल दिखाई देते हैं। encoding, inference और decoding की क्षमताएँ अधिक जटिल रूप से आपस में उलझी होती हैं और पूरे मॉडल में फैली रहती हैं। मुझे ऐसा कोई भी फ़ंक्शनल ओवरलैप नहीं मिला जो कई tasks में generalize हो सके, लेकिन यह बात स्पष्ट थी कि किसी एक 'क्षमता' को मज़बूत करने से दूसरी क्षमता कमज़ोर हो सकती है। लेकिन जैसे-जैसे मॉडल बड़ा होता है, उसकी functional structure अधिक अलग-अलग हो जाती है। बड़े मॉडलों में generalized 'thinking' circuits विकसित करने के लिए अधिक 'space' होता है, और शायद यही वजह है कि मेरी विधि 72B मॉडल पर बहुत प्रभावी रही। एक निश्चित threshold से कम parameters पर, 'reasoning cortex' मस्तिष्क के बाकी हिस्सों से पूरी तरह विभेदित नहीं होता।
अगर यह सच है, तो छोटे और बड़े मॉडलों के प्रदर्शन के बीच का अंतर और भी ज़्यादा चरम हो सकता है।
लोग अक्सर कहते हैं कि उन्हें कोड से लगाव हो जाता है,
मैं भी पहले सोचता था कि क्या मुझे कोड से लगाव होता है या नहीं,
लेकिन मैं तो एक दिन बाद ही जल्दी भूल जाने वाला इंसान हूँ, इसलिए सच कहूँ तो ठीक से नहीं जानता।
AI से मेहनत करके कोड को तराशकर बनाते समय कभी-कभी वैसा ही एहसास होता है।
आप लोगों का कोड से लगाव कितने समय तक रहता है?
paperclipनाम का एक मिलता-जुलता open source भी है।लगता है अब तो सबके लिए Monopoly शुरू हो गया है lol
किसी कार्ड को डिफेंड करने वाली, किसी क्षमता को nullify करने वाली, किसी special ability की....
अरे, "Finger" भी जर्मन था। मुझे लगा था कि यह अंग्रेज़ी है...
मैंने भी इसी तरह के रिकॉर्ड रखे हैं। पहले बस यूँ ही रिकॉर्ड करता रहा, लेकिन इन दिनों मैं agents के साथ अपने रिकॉर्ड साझा करके अस्तित्व-से-अस्तित्व के सहयोग की बात कर रहा हूँ। कई skills बनाकर साझा करता हूँ, और जो Emacs interface मैं इस्तेमाल करता हूँ उसे भी खोल दिया है, इसलिए मैं और agents सभी एक ही तरीके से वही रिकॉर्ड साझा करते हैं। कुछ चाहिए हो तो जोड़ देता हूँ, जो मुझे चाहिए वह बनाता हूँ, साथ में इस्तेमाल करते हैं, feedback देते हैं—कोई देखे तो कहेगा, सब कुछ खुद ही कर रहे हैं। लेकिन हम आपस में तो कहते हैं, अरे वाह, बड़ा मज़ा आ रहा है.
[लिंक हटाया गया]
समय की गणना की जटिलता सिर्फ फ़ॉर्मैट की समस्या नहीं है; यह उससे कहीं ज़्यादा मानव दर्शन, खगोलशास्त्र की सटीकता और संस्कृति से आती है। गणना तो सिर्फ
longसे भी आसान है। ऐतिहासिक रूप से टाइमलाइन में ऐसे कई अजीब हिस्से तय किए गए हैं जहाँ 1 + 1, 2 नहीं होता, और इसका बड़ा कारण उन कैलेंडर प्रणालियों में है जो सूर्य और पृथ्वी की सतह के कोण जैसी स्थितियों के हिसाब से बदलती हैं। ऐसे मामलों में, किसी भी स्थिति में कोरियाई सौर-चंद्र कैलेंडर पर तो कभी चर्चा तक नहीं हुई।और वह कोरिया खगोल एवं अंतरिक्ष विज्ञान संस्थान तय करता है.
और मुझे यह ज़रूर कहना होगा कि WebAssembly की entry barrier बहुत ऊँची होने के दावे बेतुके हैं। बस इतना है कि इसकी ज़रूरत, इसके लिए भुगतान करने की इच्छा से कम है। आपको तेज़ और कम footprint चाहिए, लेकिन साथ में DOM और CSS भी इस्तेमाल करना है? यह कैसी black comedy है।
यह तो बस Mozilla-स्टाइल wishful thinking के काफ़ी करीब है। फ्रंटएंड बाज़ार की प्रतिक्रिया वाली limbic system जैसी प्रकृति से संरचनात्मक रूप से बाहर नहीं निकल सकता। WebAssembly आते ही Doom 3 को port कर दिया गया था। DOM आधुनिक ब्राउज़रों में बहुत पहले ही lightweight proxy object में बदल चुका है, और आधुनिक CPU के JavaScript-विशेष instruction set तथा single-core की quantum सीमाओं को देखते हुए, ऐसा कभी नहीं होगा कि यह तरीका बाज़ार-मूल्य के लिहाज़ से बढ़त हासिल करे.
Electron के अंदर चलने वाले WebAssembly binary का क्या मतलब है? यह तो बस किसी और GitKraken CLI या rust porting की शोहरत बटोरने जैसा लगता है।
सारी बातें जैसे सही लगती हैं, यह भी सही बात है। लेकिन समस्या यह है कि ज़्यादातर समय मानव सोच का बड़ा हिस्सा भी ऐसा ही होता है। अगर मनुष्य से खोज की प्रवृत्ति हटा दी जाए, तो उसके पास हठधर्मिता के अलावा कुछ नहीं बचता।
यह कुछ Perplexity वर्ज़न के OpenClaw जैसा लग रहा है।
सहमत हूँ। मुझे भी AI से बनाई गई चीज़ों से लगाव नहीं होता। ऐसा भी लगता है कि वह मैंने नहीं बनाई।
VC portfolio कंपनियों (WithCoverage, Crosby, Anterior आदि) को गिनाते हुए, यह कहा जा रहा है कि असल में Sequoia की deal-sourcing logic को investment thesis के रूप में पैकेज कर दिया गया है। (Claude Opus 4.6)
यह दावा सही है या गलत कि यह 5MB RAM भी नहीं खाता, इस बात से अलग हटकर...
आख़िर AI एजेंट को सिर्फ 5MB RAM ही खाने की ज़रूरत कहाँ है? अगर यह किसी कारीगर डेवलपरों का एक-एक बाइट तराशकर बनाया गया, रोमांच से भरा प्रोजेक्ट होता, तो बात अलग थी...
AI क्लिक-क्लिक करके बना दिया गया है, इसलिए न यह रोमांचक है, न ही इसकी कोई खास ज़रूरत दिखती है;
साथ में पढ़ने लायक लेखों में यह भी है, लेकिन इस लेख के विपरीत सेवा software नहीं बनेगी को भी साथ में देखें