Ask HN: AI के आने के बाद, आपने अपने लिए कौन-से टूल बनाए हैं?
(news.ycombinator.com)- AI coding tools के प्रसार के साथ डेवलपर अब अपने लिए खुद के टूल सीधे बना रहे हैं, और ऐसे छोटे व कस्टम utility बड़े पैमाने पर सामने आ रहे हैं जिन्हें पहले समय के मुकाबले कम उपयोगी मानकर छोड़ दिया जाता था
- संगीत·ऑडियो प्रयोग, media conversion, home automation, health tracking आदि जैसे शौक और रोज़मर्रा की ज़िंदगी के लिए खास टूल सबसे ज्यादा उभरकर आए हैं, और कई मामलों में commercial apps की जगह self-built implementations ने ले ली है
- coding agents को isolate और parallel में चलाने के लिए sandbox और orchestration tools, तथा tmux/worktree आधारित development workflow tools बार-बार दिखाई देते हैं
- "यह आपने नहीं, AI ने बनाया है" जैसी आलोचना और AI-सहायता प्राप्त coding को पूरी तरह vibe coding नहीं मानने वाली दलील समेत, निर्माण की agency को लेकर बहस भी शामिल है
- जिन क्षेत्रों में डाउनलोड किए गए apps विज्ञापन, subscription या feature limits की वजह से केवल 80~90% जरूरतें ही पूरी करते थे, वहाँ अब यह सोच बन रही है कि हर व्यक्ति के लिए ठीक-ठीक फिट personal software नया बनाना ज्यादा तेज़ है
- "सिर्फ टाइप करना ही नहीं, AI से उपयोगी app निकलवाने में भी कौशल लगता है" जैसी पक्षधरता और "LLM इस्तेमाल करने में कोई खास कौशल नहीं, कुछ दिनों में सीखा जा सकता है" जैसी आपत्ति आमने-सामने है
डेवलपर्स ने जो बदलाव महसूस किया
- पूरे career में बनी "cost sense" को फिर से सीखना (unlearning) पड़ रहा है; यानी जिन कामों से पहले समय ज़्यादा लगने के कारण बचा जाता था, वे अब वैसे नहीं रहे
- जिनके quality, performance और maintenance standards ऊँचे हैं, वे अब भी हाथ से coding करते हैं; साथ ही यह सतर्क दृष्टिकोण भी मौजूद है कि LLM की सीमाएँ hardware constraints जैसी महसूस होती हैं
- एक ऐसे भविष्य की कल्पना, जहाँ "consumer software तुरंत, on-demand बनता है", और personal software आम हो जाएगा
- लेकिन यह भी कि हर उदाहरण आखिरकार "printer से क्या छापा गया" के स्तर का हो सकता है; इसलिए reliable और deterministic foundational tools होने पर ही ऐसे custom tools की असली कीमत साकार होगी
1 टिप्पणियां
Hacker News की राय
ddahlen: मैं क्षुद्रग्रह, धूमकेतु और धूल की orbital dynamics का अध्ययन करता हूँ, इसलिए मैंने सौर मंडल के सभी ज्ञात क्षुद्रग्रहों की गति दिखाने वाला एक सटीक visualization tool बनाया है
किसी खास क्षुद्रग्रह पर क्लिक करने पर यह JPL orbital calculations से मेल खाती ultra-precise orbit दिखाता है, और इसमें full physics, n-body problem, relativity, और non-spherical planets का प्रभाव शामिल है। यह mobile-friendly नहीं है https://dahlend.github.io/ketev/
yungbeto: मज़े के लिए मैं बहुत सारे audio experiments बनाता रहता हूँ। यह CPU पर काफ़ी भारी पड़ सकते हैं
https://www.noisetable.xyz/ VCR-जैसे interface वाला probability-based audio channels का संग्रह है, और https://concrete95.net/ Windows 95 जैसा दिखने वाला musique concrète web app है। यह freesound.org से random audio लाता है, छोटे हिस्सों को loop करता है, और synth pads या melodic synth loops को layer करने देता है, इसलिए background ambience बनाने के लिए अच्छा है। https://windso.me एक sample-based step sequencer है जिसमें आप samples खुद नहीं चुन सकते, इसलिए यह मज़ेदार तो है लेकिन अभी भी काफी सुधार चाहिए
michaelbuckbee: सबसे मज़ेदार चीज़ एक free utility Moniker है, जो फ़ाइल के content को देखकर उसे context के हिसाब से rename करती है। यह local AI model इस्तेमाल करती है, और domain name भी बढ़िया लिया है https://finalfinalreallyfinaluntitleddocumentv3.com/
सबसे उपयोगी चीज़ HutchDB है, जो AI chat या agent से call करके data store करने के लिए MCP service है। अगर आप “save that to Hutch” कहें, तो यह schema और fields infer कर लेती है, Kanban, Timeline, Grid, Calendar जैसी web views बनाती है, और results share भी किए जा सकते हैं। मैं इसे time tracking, agent-human handoff, और marketing activity बनाम subscriber count जैसी चीज़ों के लिए इस्तेमाल करता हूँ https://hutchdb.com
और यह Vercel पर host होने के बावजूद free कैसे है, यह भी जानना चाहता हूँ। अगर यह थोड़ा भी viral हुआ, तो क्या गारंटी है कि cost की वजह से यह बंद नहीं होगा या फिर $500/month billing पर नहीं चला जाएगा? sign-up के बाद https://hutchdb.com/ से https://hutchdb.com/dashboard पर redirect हो जाता है, इसलिए privacy policy और terms pages भी नहीं दिखते
Jordan-117: Gemini ने Windows से Linux पर जाने में मेरी सच में बहुत मदद की
मैं कुछ हद तक सहज था, लेकिन नए operating system पर जाने के बाद बहुत से random सवाल और अजीब edge cases आए, और अगर मैं अकेला होता तो शायद मेरे पास confidence, patience, या time की कमी पड़ जाती। किसी खास समस्या का तुरंत जवाब मिलना, बिना judged हुए और बिना reply का इंतज़ार किए, बहुत अच्छा लगा। Chrome से Firefox पर वापस जाते समय भी Gemini काम आया—अक्सर इस्तेमाल होने वाले extensions के alternatives ढूँढने में, या अगर न मिलें तो उन्हें खुद बनाने में। मैं Quod Libet के लिए Gemini और Claude की मदद से custom plugins भी बना रहा हूँ, जिनमें metadata/synced lyrics download, currently playing lyrics highlight करने वाला sidebar, और गाने के पसंदीदा हिस्सों को bookmark करने का button शामिल है। अगला काम पूरी library में lyrics search बनाना है
अपने expertise वाले क्षेत्र में शुरुआती लोगों के लिए लिखी गई अनावश्यक बातों पर समय बर्बाद नहीं करना पड़ता, और non-expert क्षेत्रों में beginner questions पूछने पर RTFM या LMGTFY सुनना नहीं पड़ता
शायद यह Google के लगातार खराब होने और रोज़मर्रा की समस्याओं के इतने जटिल हो जाने का मिला-जुला नतीजा है कि उन्हें हल करने के लिए scripts जैसी चीज़ों की ज़रूरत पड़ती है। हाल में एक समस्या “Pacific Crest Trail के पास अभी खुले और सस्ते campsites” ढूँढने की भी थी
ingvay7: मैं शाम को guitar shredding की practice करता हूँ, लेकिन व्यस्त नौकरी की वजह से amp simulator में tone dial-in करने का समय मुश्किल से मिलता है, इसलिए मैंने एक tool बनाया जिसमें “Brian May Solo Bohemian Rhapsody” जैसा prompt देने पर LLM एक JSON contract भरता है, script XML generate करती है, और उसे सीधे plugin में डाल देती है
2 मिनट में लगभग ऐसा लगता है जैसे Wembley ’85 में बजा रहा हूँ। इस pattern को generalize करने पर LLM presets ढूँढ सकता है, files upload करके ज़्यादा सटीक matching कर सकता है, और code validate होकर plugin में load हो जाता है। मैं यही contract/adapter approach Terraform, game engine presets, और CI pipelines में भी इस्तेमाल कर रहा हूँ https://vishsubramanian.me/lm-guitar-tone-generator-polychro...
guitar beginner के नज़रिए से यह डरावना भी है और मज़ेदार rabbit hole भी। अलग-अलग archetypes और genres के लिए “expert” prompts हों तो काफ़ी दिलचस्प होगा
netcoyote: निजी इस्तेमाल के लिए बनाए गए कुछ टूल हैं
sandvault https://www.codeofhonor.com/projects/sandvault/ एजेंट्स को एक अलग macOS user account में चलाता है और
sandbox-execसे इसे और मजबूत बनाता है। यह sandbox के अंदर headless browsing और iOS Simulator भी सपोर्ट करता है। clodpod https://www.codeofhonor.com/projects/clodpod/ एजेंट्स को macOS VM के अंदर चलाता है। git-multi-hook https://www.codeofhonor.com/projects/git-multi-hook/ एक dispatcher है जो इस समस्या को हल करता है कि हर git hook event पर सिर्फ एक script ही allowed होती है। TubeGate https://www.codeofhonor.com/projects/tubegate/ एक Chrome extension है जो keyword के आधार पर YouTube वीडियो ब्लॉक करता है, और push10k https://www.codeofhonor.com/projects/push10k/ एक iOS app है जो 10,000 push-ups की प्रगति ट्रैक करता है। ब्लॉग को Zola, Sveltia CMS, Cloudflare Pages/Workers, और GitHub Actions के साथ AI coding करके बनाया गया था https://www.codeofhonor.comBalgair: थोड़ा बेवकूफ़ी भरा है, लेकिन मैंने एक scraper बनाया जो सारी खबरें खींचकर युद्ध से जुड़ी खबरें ढूँढता है, उनका सार बनाता है, और फिर उन्हें Star Wars opening crawl और संगीत के साथ दिखाता है
Rantenki: मैंने Rust में हाथ से pen plotter GUI और G-code sender बनाया। पूरी तरह खुद बनाया, और इसका इकलौता user भी मैं ही हूँ
कभी-कभी प्रक्रिया खुद में महत्वपूर्ण होती है, और दिमाग लगाना भी ज़रूरी है। मैं इस अस्तित्वगत चिंता को समझता हूँ कि AI नौकरियाँ छीन लेगा और creative process से इंसानों को बाहर कर देगा, लेकिन निजी संतोष के लिए बस code लिखना भी ठीक है https://github.com/armyofevilrobots/bap-egui
wizenheimer: मैंने Claude Code के लिए QA harness रिलीज़ किया है। यह खुद screen flows पर click करने के बजाय code diff पढ़ता है, प्रभावित UI flows ढूँढता है, और उन्हें असली browser में test करता है
हर run के बाद screen recording, console logs, network requests, HAR, और Playwright trace मिलते हैं, ताकि आप ठीक-ठीक देख सकें कि agent ने क्या किया https://github.com/wizenheimer/canary
मैंने इसे Show HN पर पोस्ट करने की कोशिश की, लेकिन किसी वजह से यह flag हो गया
DonaldFisk: Dartmouth Summer Research Project on Artificial Intelligence 1956 का है, और AI खुद 1948 में William Grey Walter के Elmer और Elsie जैसे robots तक पीछे जाता है, जिसे उस समय cybernetics कहा जाता था
मैं 1980 के दशक से बीच-बीच में symbolic AI करता रहा हूँ, लेकिन यहाँ बात शायद LLM की हो रही है। मैंने LLM खुद इस्तेमाल नहीं किया है, और हाल में सीखने के उद्देश्य से C में multilayer artificial neural network implement किया। पहले मैंने Lisp में बनाए गए speech spectrograms को Unix pipes से जोड़कर एक hidden layer के साथ phonemes पहचानने की कोशिश की थी, और सिर्फ vowels होने पर यह काफी ठीक चला, लेकिन जैसे ही l, r, s, z जैसी ध्वनियाँ जोड़ीं, performance गिर गई। C code में bug नहीं लगता, लेकिन ANN को आसानी से train करना कैसे है, यह समझ नहीं आ रहा। training set बढ़ाया, layers जोड़ीं, और hidden layer neurons की संख्या बदली, लेकिन सामान्य debugging techniques यहाँ खास काम नहीं आतीं
linsomniac: NixOS और Claude Code के साथ मैंने अपने वर्कस्टेशन ऑपरेटिंग सिस्टम को फिर से डिज़ाइन किया, और यह बहुत सफल रहा
मुझे NixOS की git repository-आधारित reproducible configuration और यह पसंद है कि कुछ बिगड़ जाए तो पिछली configuration में boot किया जा सकता है, लेकिन इसे हाथ से सीखना और लागू करना बहुत बड़ा काम है। मैंने इसे लगभग 2 साल छेड़ा, लेकिन पूरी workstation setup तक नहीं पहुँच पाया। फिर मुझे Ubuntu 22.04 को upgrade करना था, इसलिए 26.04 पर जाने से पहले NixOS को गंभीरता से आज़माया। इस बार मैंने सब कुछ Claude Code से configure किया, और एक हफ्ते से इस्तेमाल कर रहा हूँ; कुछ भी कमी नहीं है। मैंने पहले इसे एक पुराने laptop पर install किया, फिर अपनी मौजूदा workstation को reinstall करने का चरणबद्ध तरीका अपनाया, और NixOS की वजह से दूसरी machine की setup लगभग मामूली रही। अब hardware मर भी जाए तो बस
/etc/nixosलाकर rebuild करना है। LunarVim/AstroVim की जगह मैंने केवल अपनी ज़रूरत के features वाला लगभग 700-lineneovim.nixभी Claude Code से बनवाया, जिसमें LSP और TreeSitter भी शामिल हैंrockmeamedee: https://github.com/amedeedaboville/mish एक mosh clone है जो QUIC transport layer का इस्तेमाल करता है
यह UDP जैसे unreliable datagram और TCP जैसे reliable stream, दोनों का उपयोग कर सकता है, इसलिए इसमें scrollback buffer है। QUIC की वजह से encryption भी उसी पर छोड़ी जा सकती है, इसलिए LLM पर खुद encryption implement करने का भरोसा नहीं करना पड़ता। terminal handling के लिए alacritty का इस्तेमाल है, और Rust implementation SSH
russhकी बदौलत यह उन environments में भी काम करता है जहाँ SSH install नहीं है, जैसे Windows, जिसे पुराना mosh support नहीं करता था। Claude ने end-to-end tests, FoundationDB-शैली network simulation, tokio async thread-order tests, 12 fuzzing targets, और हल्की protocol model checking को आगे-पीछे चलाया, और हर fuzzing round में bugs मिले। “हो सकता है bug हों, लेकिन correctness साबित कर दी है” वाले मामलों को छोड़ दें, तो यह मूल जितना, शायद उससे भी ज़्यादा भरोसेमंद लगता हैstonlyb: Workhorse CLI scripts/tools का एक bundle है जो पुराने laptop को headless SSH compute/storage node में बदल देता है, ताकि main machine उस पर काम offload कर सके
इसका मुख्य हिस्सा
onproनाम का एक router script है, जो box को check करता है, command को remote पर चलाता है, और अगर वह सो रहा हो या power से disconnected हो तो अपने-आप local fallback कर देता है। AI coding setup में PreToolUse hook build, test, ffmpeg, OCR, बड़े pandas jobs जैसे भारी commands को intercept करके उन्हें MacBook Air की जगह workhorse पर चलाता है। agent तय करता है कि क्या चलाना है, और deterministic layer यह सुनिश्चित करती है कि भारी काम सही machine पर जाए। थोड़ा और test करने के बाद इसे share करने का इरादा है। https://motate.app/ linear algebra दोहराते समय, नवजात बच्चे को गोद में पकड़े रहने की वजह से, math writing आसान बनाने की कोशिश थी; अब मैं सोच रहा हूँ कि इसे science/math writing और education में और व्यापक रूप से उपयोगी कैसे बनाया जाएxlii: कई हैं, लेकिन कुछ ऐसे हैं जिन पर मुझे खास गर्व है
https://github.com/exlee/pikchr_pl एक DiagramIDE है, जिसमें Amiga-style workbench पर TCL, Prolog, Pikchr, और हाल में mruby से Pikchr diagrams को script किया जा सकता है। https://svg.axk.sh AI-generated pseudo-vector images को आसानी से vectorize करने के लिए एक semi-manual SVG fitter है। https://github.com/exlee/rik एक AI harness है जो text editor को UI की तरह इस्तेमाल करता है, और इसे चलाते हर बार हँसी आती है। इसमें personality डाली गई है, इसलिए यह अजीब-सी टिप्पणियाँ करता है, लेकिन उसके अलावा यह बहुत सीमित agent है। यह vibe coding नहीं है, लेकिन AI बड़े friction points को बहुत आसान बना देता है, जैसे SVG fitting algorithm को फिर से बनाना, जो मैं दोबारा नहीं करना चाहता था
melvinroest: मैंने Apple Voice Memos जैसी एक voice memo app बनाई
अब मैं voice memos को iCloud पर upload करता हूँ, Claude Code उन्हें structured notes में बदल देता है, और app भी वही notes दिखाती है। मतलब मैं एक घंटे की walk पर consciousness stream की तरह बोलता जाता हूँ और Claude उसे व्यवस्थित कर देता है। सिर्फ़ अपने विचार ज़ोर से बोल देने पर उनका structured हो जाना मुझे बहुत अच्छा लगता है। यह vibe coding से बना है और tests सहित लगभग 20,000 lines तक पहुँच रहा है। यह काफ़ी अच्छा काम करता है, लेकिन bugs हैं, इसलिए कुछ असली engineering करनी होगी; UX हालांकि अच्छा काम कर रहा है
vtbassmatt: बनाते-बनाते देखा कि ज़्यादातर टूल गेम्स के आसपास के शौक़िया टूल ही निकले
परिवार की पसंदीदा recipes को सेव करने के लिए एक cookbook, ताकि कभी न कभी Pinterest से छुटकारा मिल सके https://github.com/vtbassmatt/Cookbook, कार्ड गेम Mood Swings के लिए data extraction pipeline और search engine https://moodswingsdata.github.io तथा https://moodswingsdata.github.io/feelings, दोस्तों के साथ मिलकर Magic: the Gathering cube को बार-बार बनाने के लिए एक app https://github.com/vtbassmatt/popcorn-cube, पसंदीदा podcast universe के लिए एक custom wiki engine https://github.com/vtbassmatt/totalus-wikium, और web के लिए systemd log viewer https://github.com/vtbassmatt/djournal
aleqs: मैंने एक general-purpose repository linting tool बनाया https://alint.org/ https://github.com/asamarts/alint
शुरुआत में इसका मकसद उन कई scripts को replace करना था जिन्हें मैंने AI के ढीले-ढाले बदलाव देखते हुए repo hygiene और structure validation के लिए जोड़ना शुरू किया था। बाद में मैंने कई open source repositories देखीं और यह समझा कि लोग validation के लिए किस तरह की scripts चलाते हैं, फिर उन्हें tool में सामान्य और extensible rule types के रूप में शामिल किया। यह repository structure, hygiene और दूसरी rules को declarative तरीके से define करने देता है, और बहुत तेज़ है, इसलिए pre-commit और CI workflows के लिए अच्छा है https://alint.org/benchmarks/
shibel: Tailscale में अगर आप किसी shared machine के FQDN को किसी domain पर point करें, तो वह domain सिर्फ़ उसी व्यक्ति के लिए काम करता है जिसके साथ share किया गया है https://www.youtube.com/watch?v=Vt4PDUXB_fg
लेकिन अगर आप चाहते हैं कि user को किसी app का specific port जानने की ज़रूरत न पड़े, तो उस host के 443/80 ports तक पहुँच Tailscale ACL में allow करनी पड़ती है। तब immich.familydomain.com परिवार के लिए सुविधाजनक होता है, लेकिन उसी host पर serveradmin.familydomain.com भी network के नज़रिए से पहुँचा जा सकने वाला हो जाता है। जनवरी के आसपास मैंने Claude के साथ कुछ घंटे लगाकर एक छोटा Go authentication gateway लिखा, जो Tailscale public API और
localapiदोनों को query करता है और request करने वाले user के लिए वास्तव में allowed port के आधार पर Caddy को response देता है। अब मैं सिर्फ़ Tailscale policy file से access control खोए बिना अलग-अलग लोगों के साथ अलग apps और subdomains share कर सकता हूँ। मैंने Authentik जैसी चीज़ें इसलिए नहीं इस्तेमाल कीं क्योंकि user पहले से Tailscale में logged in हैं, और मुझे नहीं लगा कि वही काम करने वाला कोई अलग भारी app install/configure करवाना और दोबारा authentication कराना ज़रूरी हैSerenacula: मेरे पास एक script है जो input prompt लेकर नई script बनाती है, और फिर skills चलाकर धीरे-धीरे bugs की जाँच और सफ़ाई करती है
इसी से मैंने एक दूसरी script भी बनाई जो मेरी सारी custom scripts को सूचीबद्ध और ट्रैक करती है। एक tool भी है जो local scripts लोड करके CLI commands को किसी खास folder environment के हिसाब से scope करता है। कुल मिलाकर, जो भी चीज़ मुझे automatable लगती है, मैं उसे बनाकर इस्तेमाल कर रहा हूँ। मैं कभी इस पर blog post लिखना चाहता था, और हाल ही में पहली बार सच में महसूस हुआ कि personalized software की दुनिया ने वास्तव में सब कुछ बदल दिया है
neonglow: मैंने एक browser extension बनाया है जो डिफ़ॉल्ट रूप से GIF जैसी animated images के autoplay को रोक देता है
browser का animated images को autoplay करना हमेशा परेशान करता था, और अब तक इसका कोई built-in control नहीं है। यह extension पहली frame दिखाता है और image के ऊपर play/stop button जोड़ता है। यह एक personal utility के रूप में शुरू हुआ था, लेकिन मैंने इसे Firefox और Chrome extension stores पर भी डाल दिया। यह एक छोटा प्रोजेक्ट है जिसने मेरी रोज़ की समस्या हल की। Firefox: https://addons.mozilla.org/en-US/firefox/addon/gif-control/ Chrome: https://chromewebstore.google.com/detail/gif-control/nhoihin... bug reports और feedback का स्वागत है। मैंने इसे पहले Show HN पर भी पोस्ट किया था, लेकिन कोई प्रतिक्रिया नहीं मिली https://news.ycombinator.com/item?id=48208916
thatmf: मैंने vibe coding से एक छोटा web app बनाया, जिसे home screen पर install किया जा सकता है, और जो बताता है कि अगले दिन मेरी पहली meeting कब है
मेरी meetings बहुत होती हैं और वे लगातार बदलती रहती हैं, लेकिन मैं फोन पर work account में login नहीं करना चाहता और न ही उस दुनिया के बारे में सोचना चाहता हूँ। मुझे बस यह जानना है कि मुझे कब उठना है। ऐप केवल समय दिखाता है, और tap करने पर title देखा जा सकता है। meeting कितनी जल्दी है, इसके हिसाब से font और color भी बदलते हैं, और अगर वह सुबह 8 बजे से पहले हो तो Nosifer इस्तेमाल करता है। मैं इसे खुद बना सकता था, लेकिन शायद बनाता नहीं। मेरे हिसाब से ऐसे simple, ultra-specialized custom utilities vibe coding के लिए एकदम सही हैं
asciimoo: मैं online search engines और AI answers पर निर्भरता कम करने के लिए self-hosted search service Hister बना रहा हूँ https://hister.org/ https://github.com/asciimoo/hister
Hister websites और local files के लिए एक full-text indexer है, और browser द्वारा render किए गए visited pages को अपने-आप save कर लेता है। यह offline result previews और एक detailed query language के साथ web और terminal search interface देता है, और ज़रूरत पड़ने पर traditional search engines पर जल्दी जाने की सुविधा भी देता है। पहले देखे गए content को ढूँढने वाली “recall” search के लिए यह privacy-friendly experience देता है, लेकिन नए content की “discovery” search के लिए अभी भी कमजोर है
hakunin: मैंने एक SQLite-आधारित sweeper बनाया है जो filesystem में मौजूद scanned documents, notes, PDFs और images को scan करके paths save करता है, और Mistral OCR द्वारा दी गई descriptions और text को searchable बनाता है
आप इससे “मुझे अपनी car की servicing कब करानी है?” या “मदर्स डे पर मेरे बच्चे ने जो drawing बनाई थी, वह ढूँढो” जैसे सवाल पूछ सकते हैं। मैं Raspberry Pi आधारित bash executable से इस तरह का document chat चलाता हूँ https://github.com/maxim/ringbinder
alphaBetaGamma: मैंने CAD में computer science और science-inspired jewelry design करने का एक tool बनाया
मैंने jewelry को represent करने के लिए एक DSL लिखा, और LLM से cadquery में CAD files generate करने वाला interpreter बनवाया। इससे यह सीख भी मिली कि LLMs 3D reasoning में कमजोर होते हैं। AI के बिना मैं शायद इसके लिए समय नहीं निकाल पाता। मैं frontend developer नहीं हूँ, इसलिए online store design करने में भी AI का इस्तेमाल किया, और यह देखकर हैरानी हुई कि मेरी पत्नी, जिसका technical background नहीं है, Claude Code से website modify कर पा रही थी। अंतिम नतीजा एक ऐसा store है जो Graham number की गणना करने वाले lambda diagrams (Tromp diagrams) या Y-combinator के करीब दिखने वाले fixed-point operator आकार की jewelry बेचता है। असली Y-combinator jewelry के नज़रिए से उतना सुंदर नहीं लगा https://studio-galois.com
mybbor: agent-style coding के आम होने से पहले ही concert और music festival के लिए sticker design बनाता था। Sticker बनाकर बाँटना नए लोगों से मिलने का अच्छा तरीका था
OpenClaw से calories और alcohol को track करके personal dashboard में रिकॉर्ड करने वाला health·wellness coach agent भी बनाया। खाने की फोटो भेजो तो वह calories का अनुमान लगाकर रिकॉर्ड करता है, meal decisions में मदद करता है, और हौसला भी देता है। HAM dashboard repository https://github.com/VA3HDL/hamdashboard का इस्तेमाल करके local video और weather feeds को इकट्ठा करने वाला custom dashboard बनाया, और उसी rabbit hole में Sonoma County local radio reference guide भी बनाया https://mybbor.com/petaluma-sonoma-ham-radio.html। कई interests और projects के लिए one-off·small-scale websites भी लगभग 12 बनाई, और short-domain file uploader से Markdown और HTML को जल्दी host करके family·friends·colleagues के साथ share करना पसंद है। यह Caddy और DigitalOcean VPS पर चलता है, और code public है https://github.com/RobbyMcCullough/honeydrop
yablak: Google Takeout से ज़्यादा incremental Google Photos backup करने वाला tool बनाया https://github.com/ebrevdo/gphoto-pull
Google छोड़ने के बाद जिसकी कमी महसूस हुई, उसका IFTTT linter version भी बनाया https://github.com/ebrevdo/ifttt-lint
jfim: बहुत सारे tools बनाए
extensible processing pipeline को support करने वाला self-hosted web archiving tool बनाया, जिसमें जैसे article extraction→translation→summary→tag generation, video download→audio separation→transcription→summary किया जा सकता है। इस दौरान extensions और WARC को support करने वाला managed Chromium browser भी बनाया, और RSS न होने वाले किसी भी article list page से feed बनाने वाला RSS synthesizer भी। native ads और sponsor blocks जैसी noise हटाकर article को साफ करने वाले model के लिए active learning loop भी है। एक tabbed terminal भी बनाया जिसमें database, app server, Claude Code को tab के हिसाब से एक साथ उठाया जा सकता है, और अगर terminal
http://localhost:4000/पढ़े तो browser अपने-आप सही URL खोल दे—ऐसी project management features भी हैं। Claude के साथ कुछ ही मिनटों में MCP server ideas जोड़कर deploy किए जा सकने वाला modular MCP server, MCP proxy और OAuth2 DCR भी हैं। Claude conversations को render करके Obsidian vault मेंconvo://claude-code/-home-jfim-projects-foo/जैसे links से जोड़ने वाला छोटा tool भी है, और कुल मिलाकर self-hosted environment में Docker container deployment के लिए इसका काफी उपयोग करता हूँ। ज़्यादातर चीज़ें GitHub पर हैं, लेकिन readiness अलग-अलग स्तर की हैjoddystreet: कुछ चीज़ें बनाई हैं
self-hosted POPSQL alternative https://github.com/p-raj/collab-sqlc, open source tools पर आधारित CleanMyMac alternative https://github.com/p-raj/open-cleanmymac, standup meetings को comics में बदलने वाला tool https://github.com/p-raj/standup-to-comics, और configurable Pomodoro https://github.com/p-raj/open-tomato। कुछ private tools और भी हैं जो अभी काम करने की हालत के करीब भी नहीं हैं
SdtEE: Excel में CSV खोलने पर होने वाले हर तरह के अजीब व्यवहार से तंग आकर एक तेज़ और हल्का CSV viewer बनाना शुरू किया
बाद में पता चला कि arbitrary size के CSV files को तुरंत load करने की technique को incremental parser combinators के रूप में generalize किया जा सकता है, और इसे किसी भी format पर लगाया जा सकता है। इसलिए यह files ही नहीं, pipe जैसे stream-oriented sources भी पढ़ सकता है। Development में AI का इस्तेमाल किया, लेकिन intuitive और consistent UX design में इतना समय लगा कि speed gains ज़्यादा नहीं मिले। अभी production-ready नहीं है, लेकिन रुचि हो तो देख सकते हैं https://github.com/Verticalysis/Hitomi
AJRF: वह पल जब लगा “ये भी हो जाएगा, सोचा नहीं था” तब आया जब GLM 5 से Ubuntu के लिए Nintendo Switch Pro 2 Controller का user-space driver बनाया
Plug in करने पर device दिखता था, लेकिन button दबाते ही pairing process शुरू करने की कोशिश करता था, और evtest में कुछ नहीं आता था। वही description लगभग ज्यों-का-त्यों prompt था, और 10 मिनट बाद reboot के बाद भी काम करने वाली systemd unit सहित driver तैयार था। कमाल की बात है
josh_p: मैंने एक Telegram bot बनाया है जो सुबह और दोपहर में लगभग एक तरह की to-do list भेज देता है। यह Google Calendar और एक जुगाड़ू memory database (SQLite) से जुड़ा है, और बच्चों ने कहा था कि यह Silksong के Yarnaby की तरह बोले
मैंने Steam saves का auto-backup भी बनाया, ताकि जब बच्चे मेरे account से वही game खेलते हुए Steam Cloud saves गड़बड़ा दें तो काम आए। flaky tests वाले repositories में failed GitHub Actions को auto-rerun करने वाला script भी बनाया। ऐसा उपयोग है जहाँ लगता है, क्या इसे सच में ठीक करने की ज़रूरत है? branches को अपने-आप main के साथ catch up भी करवाता है। एक YNAB extension भी है, pi agent harness के लिए, जो उन purchase inputs में मदद करता है जिन्हें categories में बाँटना होता है; इसे Telegram bot में डालकर voice input से purchases समझाई जा सकती हैं। पहले से मेरे पास Magic: The Gathering proxy printing के लिए PDF generate करने वाला Python script था, और LLM से set names और symbols वाले divider pages बनवाकर बड़े card boxes को organize करना आसान हो गया
geedy: मैं शुरू से एक BRep CAD kernel बना रहा हूँ
अगर fillets बहुत अच्छी तरह काम करने लगे, तो इसे open source करने का इरादा है। इसमें थोड़ा समय लगेगा, लेकिन 10 हफ्ते पहले शुरू करने के बाद से काफ़ी प्रगति हुई है। मध्यम अवधि का लक्ष्य एक GUI app निकालना है जो STEP files import करके सिर्फ़ बहुत high-quality fillets को process कर सके। लगता है कि यह कई hobby users के लिए उपयोगी होगा
smeej: मैं काफ़ी समय से Logseq इस्तेमाल कर रहा हूँ, और अच्छी बात यह है कि Logseq और उसके plugins दोनों open source हैं
मैं अक्सर इस्तेमाल होने वाले plugins को clone करके “Claude, इसमें X भी कर दो” कहता हूँ, और इस तरह लंबे समय से चाही गई सुविधाएँ जोड़ने में बहुत मज़ा आता है
mike-cardwell: https://gitlab.com/grepular/calendiff .ics URL को monitor करता है और calendar changes के बारे में email भेजता है
https://gitlab.com/grepular/foxcage Firefox को podman के अंदर चलाता है ताकि वह host से isolate रहे, और उसमें सिर्फ़ वे कुछ features डाले हैं जो मैं चाहता था। https://gitlab.com/grepular/claude-sandbox एक और Claude sandbox है, यह भी podman के अंदर चलता है और credentials की सुरक्षा के लिए एक मज़बूत proxy system रखता है। अभी मैं एक email sanitization tool पर काम कर रहा हूँ, और जब यह इतना ठीक हो जाएगा कि दूसरे लोग भी इस्तेमाल कर सकें, तब https://www.grepular.com/blog/ पर इसके बारे में लिखूँगा। यह HTML/SVG/calendar/vcard हिस्सों पर policies लागू करता है ताकि tags, attributes, CSS और URL schemes को allow/block किया जा सके, URLs को साफ़ किया जा सके, tracking रोकने के लिए remote content को delivery के समय fetch करके email में attach किया जा सके, और PGP तथा S/MIME की automatic encryption/decryption समेत बहुत सी सुविधाएँ देता है
eternityforest: मैंने yjs के साथ एक inventory tracking app बनाया था जो सिर्फ़ browser में चलता है और peer.js से sync होता है, लेकिन आजकल मैं इसका ज़्यादा उपयोग नहीं करता https://eternityforest.github.io/Stuffer/
app तो नहीं, लेकिन एक productivity system भी है। जब भी मैं कुछ भूलता हूँ, मैं AI को उसके बारे में बताता हूँ, और उस खास गलती से जुड़ी human error research references माँगते हुए उसे थोड़ा-थोड़ा refine किया है https://github.com/EternityForest/THUNDERWARS
david_shi: पिछले 3 महीनों में मैंने cloud में नए OpenClaw agents को बहुत तेज़ी से set up करने का तरीका बनाया है https://operator.io
Telegram के भीतर कई isolated agents चलाना, जिनकी अपनी memory और tasks हों, notifications automation, context tracking, और एक personal external cortex की तरह काफ़ी अच्छा रहा
flutas: मैंने एक Home Agent setup बनाया है, और Home Assistant के ज़रिए घर के अलग-अलग पहलुओं को manage करने वाले custom specialized agents हैं
यह घर के users के feedback से सीखकर सही समय पर चीज़ों को adjust करने की कोशिश करता है। इससे जुड़े कई MCP भी बनाए हैं। एक remote Claude Code server भी है, जो project-level overview देखकर laptop local की बजाय home server पर projects चलाने और develop करने देता है। यह SSH और web UI दोनों support करता है, और web UI में project list, https://xtermjs.org/ से render किया गया shell, और कई projects पर काम करते समय turn completion दिखाने वाला tiled overview है। इसी तरह local version project-scoped podman containers को अपने-आप start करता है, working directory पास करता है, CC/Codex/Grok install करता है, हर agent की auth/config आगे देता है, और फिर permissions prompts बंद करने वाले environment flags और aliases वाले shell में ले जाता है। उदाहरण के लिए, claude =
claude --dangerously-bypass-permissions। Obsidian की advanced features, plugin suggestions/installation/configuration आदि तक agents की पहुँच देने वाला एक बहुत बड़ा MCP भी है। इससे रोज़मर्रा की productivity में मदद मिली है, लेकिन ज़्यादातर मामलों में मैं अब भी हर चीज़ prompt से करवाने के बजाय सीधे code में हाथ डालना पसंद करता हूँdanielvaughn: मैं designers के लिए एक browser बना रहा हूँ। यह दूसरों के लिए भी है, लेकिन मुख्य रूप से मैं इसे अपने लिए बना रहा हूँ
मैं code के साथ काम करता हूँ, लेकिन कई बार ideas explore करने के लिए branches नहीं बनाना चाहता, न ही codebase में demo components और files का बिखराव करना चाहता हूँ। अगर एक सामान्य browser में developer tools होते हैं, तो इस browser में design tools built-in हैं। आप app पर जाते हैं, आसपास का canvas खोलते हैं, टुकड़ों को canvas पर खींचकर design-जैसा काम करते हैं, और फिर उसे वापस code में merge कर सकते हैं। यह सब एक ही UI में होता है। यह इतना अच्छा बन रहा है कि मैं इसे public करूँगा, लेकिन अभी भी यह मेरे लिए बहुत उपयोगी है https://matry.design/
margarita_dev: शुरू से ही जिन चीज़ों को बनाकर देखना चाहता था, उनकी सूची में हमेशा एक programming language रही, और AI की मदद से उसे पूरा कर लिया।
कंपनी में AI workflow और skill library की दो बड़ी समस्याएँ दिखीं। जब पूरा workflow 100-step Markdown file हो, तो determinism की कमी होती है, और Markdown skill library में composability कम होती है, जिससे DRY का उल्लंघन होता है। Margarita, Markdown और logical operators को साथ रहने देती है, ताकि ज़रूरत पड़ने पर code structure से determinism लाई जा सके और आवश्यकता होने पर LLM dynamic code पर जाया जा सके। इसके अलावा, यह React जैसी composable prompts की अनुमति देती है, जिससे text के इधर-उधर बिखरे होने वाली skill library की समस्या भी हल होती है। Reddit पर प्रतिक्रिया ठंडी रही, इसलिए शायद इसे बंद कर दूँ, लेकिन इसे बनाने की प्रक्रिया बहुत मज़ेदार थी। लगभग सभी LLM providers के लिए code agents बनाए और अपना harness भी बनाया; सीखने के लिए यह बहुत अच्छा अनुभव था, इसलिए इसकी सिफारिश करूँगा। https://www.margarita.run https://github.com/Banyango/margarita
jtap: अपनी बेटी, दोस्तों और खुद के लिए Pokemon card scan/index tool बनाता रहा हूँ https://MyBulkCards.com
यह एक mobile app और website से मिलकर बना है, और app कैमरे से कार्ड स्कैन करके images को कुछ models से गुजारता है, फिर card और उसकी location history सेव करता है। यह बुनियादी है, लेकिन “Box 1 AAA, Box 1 BBB …” जैसी box locations सेव कर सकता है, जिससे कार्ड आसानी से मिल जाते हैं। इसमें friends feature भी है, इसलिए आसपास के दोस्त कौन-से कार्ड रखते हैं यह देखा जा सकता है, और हम अक्सर आपस में कार्ड उधार लेते हैं। इसे बनाना सचमुच बहुत मज़ेदार रहा, और अभी-अभी Android app store approval मिला है। थोड़ा और व्यवस्थित करने के बाद इसे जल्द ही सार्वजनिक करूँगा।