Ask HN: AI के आने के बाद, आपने अपने लिए कौन-से टूल बनाए हैं?

(news.ycombinator.com)

7 पॉइंट द्वारा GN⁺ 2026-06-10 | 8 टिप्पणियां | WhatsApp पर शेयर करें

AI coding tools के प्रसार के साथ डेवलपर अब अपने लिए खुद के टूल सीधे बना रहे हैं, और ऐसे छोटे व कस्टम utility बड़े पैमाने पर सामने आ रहे हैं जिन्हें पहले समय के मुकाबले कम उपयोगी मानकर छोड़ दिया जाता था
संगीत·ऑडियो प्रयोग, media conversion, home automation, health tracking आदि जैसे शौक और रोज़मर्रा की ज़िंदगी के लिए खास टूल सबसे ज्यादा उभरकर आए हैं, और कई मामलों में commercial apps की जगह self-built implementations ने ले ली है
coding agents को isolate और parallel में चलाने के लिए sandbox और orchestration tools, तथा tmux/worktree आधारित development workflow tools बार-बार दिखाई देते हैं
"यह आपने नहीं, AI ने बनाया है" जैसी आलोचना और AI-सहायता प्राप्त coding को पूरी तरह vibe coding नहीं मानने वाली दलील समेत, निर्माण की agency को लेकर बहस भी शामिल है
जिन क्षेत्रों में डाउनलोड किए गए apps विज्ञापन, subscription या feature limits की वजह से केवल 80~90% जरूरतें ही पूरी करते थे, वहाँ अब यह सोच बन रही है कि हर व्यक्ति के लिए ठीक-ठीक फिट personal software नया बनाना ज्यादा तेज़ है
"सिर्फ टाइप करना ही नहीं, AI से उपयोगी app निकलवाने में भी कौशल लगता है" जैसी पक्षधरता और "LLM इस्तेमाल करने में कोई खास कौशल नहीं, कुछ दिनों में सीखा जा सकता है" जैसी आपत्ति आमने-सामने है

डेवलपर्स ने जो बदलाव महसूस किया

पूरे career में बनी "cost sense" को फिर से सीखना (unlearning) पड़ रहा है; यानी जिन कामों से पहले समय ज़्यादा लगने के कारण बचा जाता था, वे अब वैसे नहीं रहे
जिनके quality, performance और maintenance standards ऊँचे हैं, वे अब भी हाथ से coding करते हैं; साथ ही यह सतर्क दृष्टिकोण भी मौजूद है कि LLM की सीमाएँ hardware constraints जैसी महसूस होती हैं
एक ऐसे भविष्य की कल्पना, जहाँ "consumer software तुरंत, on-demand बनता है", और personal software आम हो जाएगा
लेकिन यह भी कि हर उदाहरण आखिरकार "printer से क्या छापा गया" के स्तर का हो सकता है; इसलिए reliable और deterministic foundational tools होने पर ही ऐसे custom tools की असली कीमत साकार होगी

8 टिप्पणियां

xguru 2026-06-10

फिलहाल, मैंने अपना 23 साल पुराना निजी ब्लॉग https://xguru.net/ WordPress से Cloudflare + Hugo पर शिफ्ट किया है, और migration tool व CMS दोनों खुद बना लिए। यह एक छोटा Lightsail instance था, लेकिन ऐसा करके मैंने मासिक खर्च पूरी तरह शून्य कर दिया। इसके अलावा, कुछ सरल फीचर मैं Workers से बनाकर इस्तेमाल कर रहा हूँ। बोर्डगेम मीटअप मैनेजमेंट टूल भी ब्लॉग के भीतर ही चलाता हूँ। ईमेल भेजने के लिए Resend इस्तेमाल करता हूँ.

मैंने बोर्डगेम कार्ड/मैनुअल का Korean localization tool भी बनाकर इस्तेमाल कर रहा हूँ। मैं ऐसे कई English गेम खरीदता हूँ जो कोरिया में आसानी से नहीं मिलते, इसलिए उन्हें सिर्फ निजी उपयोग के लिए Korean में localize करता हूँ। यह translate करता है, template के रूप में बनाता है, कार्ड पर apply करता है, और PDF output भी अपने-आप तैयार कर देता है, इसलिए काफी सुविधाजनक है.

इसके अलावा भी ऐसे niche tools हैं जो इतने निजी उद्देश्य के हिसाब से बने हैं कि उन्हें सार्वजनिक करना भी मुश्किल है, लेकिन पहले जिन चीज़ों के लिए पैसे देकर software लेना पड़ता था, अब वे सब मैं खुद बनाकर इस्तेमाल कर रहा हूँ। जैसा ऊपर कहा, shareware की जगह अपने बनाए tools से replace कर देना ही शायद सबसे बड़ी बात है।

dokkebi 2026-06-10

मैंने dokkebi-cli नाम का एक serverless framework बनाया है.. इसका आर्किटेक्चर थोड़ा अनोखा है, जिसमें business logic client side पर encrypt होकर execute होता है। इसलिए deploy करते समय client + backend साथ में deploy होते हैं। cloudflare के साथ इसकी compatibility बेहतरीन है, और rollback भी one-click rollback से हो जाता है, साथ ही update के समय user साइट पर तुरंत update message भी देख सकता है.. hacking की समस्या सबसे बड़ी समस्या तो है ही.. इसलिए workers का इस्तेमाल अनिवार्य है, लेकिन CPU level का उपयोग इतना कम होता है कि लगभग बिना किसी खर्च के MVP projects को जितना चाहें चलाकर देखा जा सकता है, यही शायद इसका सबसे बड़ा फायदा है.

अभी भी 5 डॉलर देकर unlimited service creation test कर रहा हूँ, लेकिन trend client-first और wasm की तरफ जाएगा.

laeyoung 2026-06-11

वाह, कमाल है!

shm3215 2026-06-10

AWS इस्तेमाल करने वाले नज़रिए से computing resources की छिपी हुई लागत का दबाव काफ़ी ज़्यादा है,
लेकिन Cloudflare के ज़रिए client side में business logic को पिरोने का आइडिया ताज़गीभरा है।
बिना खर्च वाला mvp प्रोजेक्ट... मुझे भी इसे आज़माना चाहिए

kw9101 2026-06-11

मैंने झींगा aquarium के लिए एक cooler बनाया, ताकि भीषण गर्मियों की heatwave से निपटा जा सके। esp32, Peltier element, haos वगैरह को अच्छी तरह मिलाकर बनाया। मुझे electrical/electronics की जानकारी नहीं थी, लेकिन बहुत मदद मिली।

savvykang 2026-06-10

मैंने work directory के लिए tray app अलग-अलग macOS और WPF में बनाकर इस्तेमाल किए हैं। हर दिन repo को तीन-चार बार switch करना पड़ता था, और हफ्ते में कई बार project बनाते समय git init/pull करना, agent या terminal चलाना जैसी झंझटें थीं, जिन्हें इससे हल कर लिया।

GN⁺ 2026-06-10

Hacker News की राय

ddahlen: मैं क्षुद्रग्रह, धूमकेतु और धूल की orbital dynamics का अध्ययन करता हूँ, इसलिए मैंने सौर मंडल के सभी ज्ञात क्षुद्रग्रहों की गति दिखाने वाला एक सटीक visualization tool बनाया है
किसी खास क्षुद्रग्रह पर क्लिक करने पर यह JPL orbital calculations से मेल खाती ultra-precise orbit दिखाता है, और इसमें full physics, n-body problem, relativity, और non-spherical planets का प्रभाव शामिल है। यह mobile-friendly नहीं है https://dahlend.github.io/ketev/
yungbeto: मज़े के लिए मैं बहुत सारे audio experiments बनाता रहता हूँ। यह CPU पर काफ़ी भारी पड़ सकते हैं
https://www.noisetable.xyz/ VCR-जैसे interface वाला probability-based audio channels का संग्रह है, और https://concrete95.net/ Windows 95 जैसा दिखने वाला musique concrète web app है। यह freesound.org से random audio लाता है, छोटे हिस्सों को loop करता है, और synth pads या melodic synth loops को layer करने देता है, इसलिए background ambience बनाने के लिए अच्छा है। https://windso.me एक sample-based step sequencer है जिसमें आप samples खुद नहीं चुन सकते, इसलिए यह मज़ेदार तो है लेकिन अभी भी काफी सुधार चाहिए
- BrokenCogs: Firefox में noisetable.xyz खोलने पर security warning आता है
- kokkis: https://concrete95.net/ देखा, वाकई बहुत शानदार है
michaelbuckbee: सबसे मज़ेदार चीज़ एक free utility Moniker है, जो फ़ाइल के content को देखकर उसे context के हिसाब से rename करती है। यह local AI model इस्तेमाल करती है, और domain name भी बढ़िया लिया है https://finalfinalreallyfinaluntitleddocumentv3.com/
सबसे उपयोगी चीज़ HutchDB है, जो AI chat या agent से call करके data store करने के लिए MCP service है। अगर आप “save that to Hutch” कहें, तो यह schema और fields infer कर लेती है, Kanban, Timeline, Grid, Calendar जैसी web views बनाती है, और results share भी किए जा सकते हैं। मैं इसे time tracking, agent-human handoff, और marketing activity बनाम subscriber count जैसी चीज़ों के लिए इस्तेमाल करता हूँ https://hutchdb.com
- Mystery-Machine: मुझे जिज्ञासा है कि आपको कैसे पता चलता है कि “लोग इसे कई तरह से इस्तेमाल करते हैं।” privacy policy देखकर चिंता हुई कि AI agents शायद API keys Hutch में leak कर सकते हैं, और तब service operator उन्हें पढ़ सकता है
  और यह Vercel पर host होने के बावजूद free कैसे है, यह भी जानना चाहता हूँ। अगर यह थोड़ा भी viral हुआ, तो क्या गारंटी है कि cost की वजह से यह बंद नहीं होगा या फिर $500/month billing पर नहीं चला जाएगा? sign-up के बाद https://hutchdb.com/ से https://hutchdb.com/dashboard पर redirect हो जाता है, इसलिए privacy policy और terms pages भी नहीं दिखते
Jordan-117: Gemini ने Windows से Linux पर जाने में मेरी सच में बहुत मदद की
मैं कुछ हद तक सहज था, लेकिन नए operating system पर जाने के बाद बहुत से random सवाल और अजीब edge cases आए, और अगर मैं अकेला होता तो शायद मेरे पास confidence, patience, या time की कमी पड़ जाती। किसी खास समस्या का तुरंत जवाब मिलना, बिना judged हुए और बिना reply का इंतज़ार किए, बहुत अच्छा लगा। Chrome से Firefox पर वापस जाते समय भी Gemini काम आया—अक्सर इस्तेमाल होने वाले extensions के alternatives ढूँढने में, या अगर न मिलें तो उन्हें खुद बनाने में। मैं Quod Libet के लिए Gemini और Claude की मदद से custom plugins भी बना रहा हूँ, जिनमें metadata/synced lyrics download, currently playing lyrics highlight करने वाला sidebar, और गाने के पसंदीदा हिस्सों को bookmark करने का button शामिल है। अगला काम पूरी library में lyrics search बनाना है
- sufficientsoup: इसी तरह Arch Linux पर जाने में भी मदद मिली। यह अपने-आप में tool नहीं है, लेकिन Arch Wiki को सामने रखकर “मेरा hardware X है और use case Y है, इसलिए बेकार के 90% हिस्से हटा दो” कहना बहुत सुविधाजनक था
- ozim: “मेरी specific problem का तुरंत जवाब देता है और judge नहीं करता” — यही killer feature है। AGI न भी बने, तो कम से कम “मेरी जगह search कर देने वाली कोई चीज़” तो हमें मिल ही गई है
  अपने expertise वाले क्षेत्र में शुरुआती लोगों के लिए लिखी गई अनावश्यक बातों पर समय बर्बाद नहीं करना पड़ता, और non-expert क्षेत्रों में beginner questions पूछने पर RTFM या LMGTFY सुनना नहीं पड़ता
- joe_the_user: ChatGPT ने अनगिनत छोटे technical problems में मदद की है, और अब यह लगभग अपरिहार्य सा लगता है
  शायद यह Google के लगातार खराब होने और रोज़मर्रा की समस्याओं के इतने जटिल हो जाने का मिला-जुला नतीजा है कि उन्हें हल करने के लिए scripts जैसी चीज़ों की ज़रूरत पड़ती है। हाल में एक समस्या “Pacific Crest Trail के पास अभी खुले और सस्ते campsites” ढूँढने की भी थी
ingvay7: मैं शाम को guitar shredding की practice करता हूँ, लेकिन व्यस्त नौकरी की वजह से amp simulator में tone dial-in करने का समय मुश्किल से मिलता है, इसलिए मैंने एक tool बनाया जिसमें “Brian May Solo Bohemian Rhapsody” जैसा prompt देने पर LLM एक JSON contract भरता है, script XML generate करती है, और उसे सीधे plugin में डाल देती है
2 मिनट में लगभग ऐसा लगता है जैसे Wembley ’85 में बजा रहा हूँ। इस pattern को generalize करने पर LLM presets ढूँढ सकता है, files upload करके ज़्यादा सटीक matching कर सकता है, और code validate होकर plugin में load हो जाता है। मैं यही contract/adapter approach Terraform, game engine presets, और CI pipelines में भी इस्तेमाल कर रहा हूँ https://vishsubramanian.me/lm-guitar-tone-generator-polychro...
- BrokenCogs: शानदार। मैं भी कुछ ऐसा ही सोच रहा था, लेकिन जानना चाहता हूँ कि Neural DSP जैसी चीज़ों की बजाय आपने Polychrome DSP क्यों चुना
- sailfast: prompt की असली कुंजी शायद इस ज्ञान में है कि tone मूल रूप से कैसे बनाई गई थी। यानी 80s system prompt की तरह आपको असली tone knowledge चाहिए, और fine-tuning वाला हिस्सा LLM पर छोड़ते हैं
  guitar beginner के नज़रिए से यह डरावना भी है और मज़ेदार rabbit hole भी। अलग-अलग archetypes और genres के लिए “expert” prompts हों तो काफ़ी दिलचस्प होगा
netcoyote: निजी इस्तेमाल के लिए बनाए गए कुछ टूल हैं
sandvault https://www.codeofhonor.com/projects/sandvault/ एजेंट्स को एक अलग macOS user account में चलाता है और sandbox-exec से इसे और मजबूत बनाता है। यह sandbox के अंदर headless browsing और iOS Simulator भी सपोर्ट करता है। clodpod https://www.codeofhonor.com/projects/clodpod/ एजेंट्स को macOS VM के अंदर चलाता है। git-multi-hook https://www.codeofhonor.com/projects/git-multi-hook/ एक dispatcher है जो इस समस्या को हल करता है कि हर git hook event पर सिर्फ एक script ही allowed होती है। TubeGate https://www.codeofhonor.com/projects/tubegate/ एक Chrome extension है जो keyword के आधार पर YouTube वीडियो ब्लॉक करता है, और push10k https://www.codeofhonor.com/projects/push10k/ एक iOS app है जो 10,000 push-ups की प्रगति ट्रैक करता है। ब्लॉग को Zola, Sveltia CMS, Cloudflare Pages/Workers, और GitHub Actions के साथ AI coding करके बनाया गया था https://www.codeofhonor.com
- ElFitz: अगर Guild Wars, Starcraft, Warcraft, Diablo पर काम करने का अनुभव सच है, तो यह सचमुच कमाल की जगह है
- bdickason: कल Warcraft और Starcraft के निर्माण की कहानी पढ़ते-पढ़ते यह ब्लॉग मिला। मैं छोटे गेम्स और 3D environment बनाने के टूल बना रहा हूँ, और पुरानी कहानियों से बहुत प्रेरणा मिलती है
- somberi: Push10K की वजह से मैं 160 दिनों की लगातार streak और 13,135 push-ups तक पहुँच गया। पिछले Christmas dinner के बाद ज़्यादा खा लेने की भावना से शुरू किया था, और यह मेरे सबसे अच्छे फैसलों में से एक रहा
Balgair: थोड़ा बेवकूफ़ी भरा है, लेकिन मैंने एक scraper बनाया जो सारी खबरें खींचकर युद्ध से जुड़ी खबरें ढूँढता है, उनका सार बनाता है, और फिर उन्हें Star Wars opening crawl और संगीत के साथ दिखाता है
- userbinator: अगर इसे YouTube पर डालो, तो शायद दर्शक मिल जाएँ
- properbrew: सोच रहा हूँ कि क्या इसे subscribe करके पाया जा सकता है
Rantenki: मैंने Rust में हाथ से pen plotter GUI और G-code sender बनाया। पूरी तरह खुद बनाया, और इसका इकलौता user भी मैं ही हूँ
कभी-कभी प्रक्रिया खुद में महत्वपूर्ण होती है, और दिमाग लगाना भी ज़रूरी है। मैं इस अस्तित्वगत चिंता को समझता हूँ कि AI नौकरियाँ छीन लेगा और creative process से इंसानों को बाहर कर देगा, लेकिन निजी संतोष के लिए बस code लिखना भी ठीक है https://github.com/armyofevilrobots/bap-egui
- efortis: लगता है यह Web Serial API के साथ प्रयोग करने वाले मेरे अगले प्रोजेक्ट्स में से एक होगा। मेरा पुराना Ioline plotter अभी भी चल रहा है। SVG से G-code conversion कहाँ से शुरू करूँ, इस पर कोई सलाह चाहिए
- duckerduck: मैं अभी खुद pen plotter डिज़ाइन और बना रहा हूँ, और यह देखकर हैरानी हुई कि अच्छा software कितना कम है। इसे ज़रूर आज़माऊँगा
- nha1: मैं पूछने वाला था कि pen plotter क्या होता है, लेकिन यह तो असली pen से drawing करने वाले printer जैसा है, बहुत शानदार
wizenheimer: मैंने Claude Code के लिए QA harness रिलीज़ किया है। यह खुद screen flows पर click करने के बजाय code diff पढ़ता है, प्रभावित UI flows ढूँढता है, और उन्हें असली browser में test करता है
हर run के बाद screen recording, console logs, network requests, HAR, और Playwright trace मिलते हैं, ताकि आप ठीक-ठीक देख सकें कि agent ने क्या किया https://github.com/wizenheimer/canary
मैंने इसे Show HN पर पोस्ट करने की कोशिश की, लेकिन किसी वजह से यह flag हो गया
- pred_: प्रोफ़ाइल को जल्दी से देखने पर लगता है कि ज़्यादातर submissions Show HN हैं। HN इस बात को सीमित करता है कि submissions में से सिर्फ कुछ ही Show HN हों, इसलिए एक बिंदु के बाद यह अपने-आप flag हो सकता है
- schmookeeg: यह उन टुकड़ों-टुकड़ों में बनाए गए versions की तुलना में कहीं ज़्यादा consistent version लगता है जिन्हें मैं खुद जोड़ता रहा हूँ। इसे एक बार चलाकर देखूँगा
DonaldFisk: Dartmouth Summer Research Project on Artificial Intelligence 1956 का है, और AI खुद 1948 में William Grey Walter के Elmer और Elsie जैसे robots तक पीछे जाता है, जिसे उस समय cybernetics कहा जाता था
मैं 1980 के दशक से बीच-बीच में symbolic AI करता रहा हूँ, लेकिन यहाँ बात शायद LLM की हो रही है। मैंने LLM खुद इस्तेमाल नहीं किया है, और हाल में सीखने के उद्देश्य से C में multilayer artificial neural network implement किया। पहले मैंने Lisp में बनाए गए speech spectrograms को Unix pipes से जोड़कर एक hidden layer के साथ phonemes पहचानने की कोशिश की थी, और सिर्फ vowels होने पर यह काफी ठीक चला, लेकिन जैसे ही l, r, s, z जैसी ध्वनियाँ जोड़ीं, performance गिर गई। C code में bug नहीं लगता, लेकिन ANN को आसानी से train करना कैसे है, यह समझ नहीं आ रहा। training set बढ़ाया, layers जोड़ीं, और hidden layer neurons की संख्या बदली, लेकिन सामान्य debugging techniques यहाँ खास काम नहीं आतीं
- kingkongjaffa: यह दिलचस्प है कि आपने खुद इस्तेमाल नहीं किया। आपकी पृष्ठभूमि देखते हुए जिज्ञासा होना स्वाभाविक लगता है, तो जानना चाहूँगा कि आपने इसे क्यों नहीं आज़माया
- changadera: आपने LLM खुद इस्तेमाल नहीं किया, यह सच कहूँ तो काफ़ी प्रभावशाली है
linsomniac: NixOS और Claude Code के साथ मैंने अपने वर्कस्टेशन ऑपरेटिंग सिस्टम को फिर से डिज़ाइन किया, और यह बहुत सफल रहा
मुझे NixOS की git repository-आधारित reproducible configuration और यह पसंद है कि कुछ बिगड़ जाए तो पिछली configuration में boot किया जा सकता है, लेकिन इसे हाथ से सीखना और लागू करना बहुत बड़ा काम है। मैंने इसे लगभग 2 साल छेड़ा, लेकिन पूरी workstation setup तक नहीं पहुँच पाया। फिर मुझे Ubuntu 22.04 को upgrade करना था, इसलिए 26.04 पर जाने से पहले NixOS को गंभीरता से आज़माया। इस बार मैंने सब कुछ Claude Code से configure किया, और एक हफ्ते से इस्तेमाल कर रहा हूँ; कुछ भी कमी नहीं है। मैंने पहले इसे एक पुराने laptop पर install किया, फिर अपनी मौजूदा workstation को reinstall करने का चरणबद्ध तरीका अपनाया, और NixOS की वजह से दूसरी machine की setup लगभग मामूली रही। अब hardware मर भी जाए तो बस /etc/nixos लाकर rebuild करना है। LunarVim/AstroVim की जगह मैंने केवल अपनी ज़रूरत के features वाला लगभग 700-line neovim.nix भी Claude Code से बनवाया, जिसमें LSP और TreeSitter भी शामिल हैं
- karl_gluck: मैं पुराने ThinkPad पर NixOS आज़माना चाहता हूँ। Claude से मैं काफ़ी परिचित हूँ, लेकिन क्या बस उससे पूछते हुए आगे बढ़ना ठीक रहेगा, या शुरू करने के लिए कोई टिप्स हैं?
rockmeamedee: https://github.com/amedeedaboville/mish एक mosh clone है जो QUIC transport layer का इस्तेमाल करता है
यह UDP जैसे unreliable datagram और TCP जैसे reliable stream, दोनों का उपयोग कर सकता है, इसलिए इसमें scrollback buffer है। QUIC की वजह से encryption भी उसी पर छोड़ी जा सकती है, इसलिए LLM पर खुद encryption implement करने का भरोसा नहीं करना पड़ता। terminal handling के लिए alacritty का इस्तेमाल है, और Rust implementation SSH russh की बदौलत यह उन environments में भी काम करता है जहाँ SSH install नहीं है, जैसे Windows, जिसे पुराना mosh support नहीं करता था। Claude ने end-to-end tests, FoundationDB-शैली network simulation, tokio async thread-order tests, 12 fuzzing targets, और हल्की protocol model checking को आगे-पीछे चलाया, और हर fuzzing round में bugs मिले। “हो सकता है bug हों, लेकिन correctness साबित कर दी है” वाले मामलों को छोड़ दें, तो यह मूल जितना, शायद उससे भी ज़्यादा भरोसेमंद लगता है
- hackernudes: मैं कुछ सालों से ऐसा कुछ सोच रहा था। इसे ज़रूर देखूँगा
stonlyb: Workhorse CLI scripts/tools का एक bundle है जो पुराने laptop को headless SSH compute/storage node में बदल देता है, ताकि main machine उस पर काम offload कर सके
इसका मुख्य हिस्सा onpro नाम का एक router script है, जो box को check करता है, command को remote पर चलाता है, और अगर वह सो रहा हो या power से disconnected हो तो अपने-आप local fallback कर देता है। AI coding setup में PreToolUse hook build, test, ffmpeg, OCR, बड़े pandas jobs जैसे भारी commands को intercept करके उन्हें MacBook Air की जगह workhorse पर चलाता है। agent तय करता है कि क्या चलाना है, और deterministic layer यह सुनिश्चित करती है कि भारी काम सही machine पर जाए। थोड़ा और test करने के बाद इसे share करने का इरादा है। https://motate.app/ linear algebra दोहराते समय, नवजात बच्चे को गोद में पकड़े रहने की वजह से, math writing आसान बनाने की कोशिश थी; अब मैं सोच रहा हूँ कि इसे science/math writing और education में और व्यापक रूप से उपयोगी कैसे बनाया जाए
xlii: कई हैं, लेकिन कुछ ऐसे हैं जिन पर मुझे खास गर्व है
https://github.com/exlee/pikchr_pl एक DiagramIDE है, जिसमें Amiga-style workbench पर TCL, Prolog, Pikchr, और हाल में mruby से Pikchr diagrams को script किया जा सकता है। https://svg.axk.sh AI-generated pseudo-vector images को आसानी से vectorize करने के लिए एक semi-manual SVG fitter है। https://github.com/exlee/rik एक AI harness है जो text editor को UI की तरह इस्तेमाल करता है, और इसे चलाते हर बार हँसी आती है। इसमें personality डाली गई है, इसलिए यह अजीब-सी टिप्पणियाँ करता है, लेकिन उसके अलावा यह बहुत सीमित agent है। यह vibe coding नहीं है, लेकिन AI बड़े friction points को बहुत आसान बना देता है, जैसे SVG fitting algorithm को फिर से बनाना, जो मैं दोबारा नहीं करना चाहता था
- rpdillon: मैं pikchr-in-wasm IDE experiment पर वापस जाने ही वाला था। मैंने सिर्फ़ PoC बनाया था, और वह भी AI coding से पहले, लेकिन DiagramIDE देखकर लग रहा है कि शायद मैं वही इस्तेमाल कर लूँ। यह thread HN को किसी पसंदीदा app store जैसा बना रहा है
melvinroest: मैंने Apple Voice Memos जैसी एक voice memo app बनाई
अब मैं voice memos को iCloud पर upload करता हूँ, Claude Code उन्हें structured notes में बदल देता है, और app भी वही notes दिखाती है। मतलब मैं एक घंटे की walk पर consciousness stream की तरह बोलता जाता हूँ और Claude उसे व्यवस्थित कर देता है। सिर्फ़ अपने विचार ज़ोर से बोल देने पर उनका structured हो जाना मुझे बहुत अच्छा लगता है। यह vibe coding से बना है और tests सहित लगभग 20,000 lines तक पहुँच रहा है। यह काफ़ी अच्छा काम करता है, लेकिन bugs हैं, इसलिए कुछ असली engineering करनी होगी; UX हालांकि अच्छा काम कर रहा है
- prometheus76: मैंने भी हाल में कुछ ऐसा ही शुरू किया है: चलते हुए बोलना। मैं mic वाले हल्के gamer headphones से एक सामान्य recording app में रिकॉर्ड करता हूँ, और घर लौटकर local whisper instance से उसका transcription करता हूँ। transcription और recording को database में डाल देता हूँ ताकि full-text search कर सकूँ या AI से अपने विचारों में दिलचस्प patterns ढूँढवा सकूँ
- derwiki: बढ़िया। लेकिन मैं जानना चाहूँगा कि आप लोग बस ChatGPT या Claude का advanced voice mode ही क्यों नहीं इस्तेमाल करते
- camillomiller: यह तो लगभग Plaud का पूरा business model ही है
vtbassmatt: बनाते-बनाते देखा कि ज़्यादातर टूल गेम्स के आसपास के शौक़िया टूल ही निकले
परिवार की पसंदीदा recipes को सेव करने के लिए एक cookbook, ताकि कभी न कभी Pinterest से छुटकारा मिल सके https://github.com/vtbassmatt/Cookbook, कार्ड गेम Mood Swings के लिए data extraction pipeline और search engine https://moodswingsdata.github.io तथा https://moodswingsdata.github.io/feelings, दोस्तों के साथ मिलकर Magic: the Gathering cube को बार-बार बनाने के लिए एक app https://github.com/vtbassmatt/popcorn-cube, पसंदीदा podcast universe के लिए एक custom wiki engine https://github.com/vtbassmatt/totalus-wikium, और web के लिए systemd log viewer https://github.com/vtbassmatt/djournal
- kigiri: https://github.com/vtbassmatt/djournal शायद public repository नहीं है। मैं https://github.com/ralsina/grafito इस्तेमाल कर रहा हूँ, लेकिन उससे पूरी तरह संतुष्ट नहीं हूँ
- jvvw: मैं भी गेम्स वाली तरफ़ हूँ, मेरे मामले में geoguessr। AI न होता तो जिन टूल्स पर समय लगाना भी ठीक न लगता, वे AI की वजह से आसानी से बन गए
- Schlagbohrer: recipe storage के लिए Mealie अच्छा है, और खुद coding करने की ज़रूरत भी नहीं पड़ी
aleqs: मैंने एक general-purpose repository linting tool बनाया https://alint.org/ https://github.com/asamarts/alint
शुरुआत में इसका मकसद उन कई scripts को replace करना था जिन्हें मैंने AI के ढीले-ढाले बदलाव देखते हुए repo hygiene और structure validation के लिए जोड़ना शुरू किया था। बाद में मैंने कई open source repositories देखीं और यह समझा कि लोग validation के लिए किस तरह की scripts चलाते हैं, फिर उन्हें tool में सामान्य और extensible rule types के रूप में शामिल किया। यह repository structure, hygiene और दूसरी rules को declarative तरीके से define करने देता है, और बहुत तेज़ है, इसलिए pre-commit और CI workflows के लिए अच्छा है https://alint.org/benchmarks/
shibel: Tailscale में अगर आप किसी shared machine के FQDN को किसी domain पर point करें, तो वह domain सिर्फ़ उसी व्यक्ति के लिए काम करता है जिसके साथ share किया गया है https://www.youtube.com/watch?v=Vt4PDUXB_fg
लेकिन अगर आप चाहते हैं कि user को किसी app का specific port जानने की ज़रूरत न पड़े, तो उस host के 443/80 ports तक पहुँच Tailscale ACL में allow करनी पड़ती है। तब immich.familydomain.com परिवार के लिए सुविधाजनक होता है, लेकिन उसी host पर serveradmin.familydomain.com भी network के नज़रिए से पहुँचा जा सकने वाला हो जाता है। जनवरी के आसपास मैंने Claude के साथ कुछ घंटे लगाकर एक छोटा Go authentication gateway लिखा, जो Tailscale public API और localapi दोनों को query करता है और request करने वाले user के लिए वास्तव में allowed port के आधार पर Caddy को response देता है। अब मैं सिर्फ़ Tailscale policy file से access control खोए बिना अलग-अलग लोगों के साथ अलग apps और subdomains share कर सकता हूँ। मैंने Authentik जैसी चीज़ें इसलिए नहीं इस्तेमाल कीं क्योंकि user पहले से Tailscale में logged in हैं, और मुझे नहीं लगा कि वही काम करने वाला कोई अलग भारी app install/configure करवाना और दोबारा authentication कराना ज़रूरी है
- sfifs: Cloudflare Zero Trust इस काम के लिए शानदार रहा, और free tier में भी बढ़िया चलता है। मेरा domain registrar भी Cloudflare ही है
- dizhn: Authentik की तुलना में Pangolin शायद इसके लिए ज़्यादा सीधे तौर पर फिट बैठता। अब इसमें built-in idP भी है, लेकिन Authentik भी इस्तेमाल किया जा सकता है। Netbird पर भी नज़र डालने लायक है; यह Tailscale जैसा mesh है, लेकिन authentication हो या न हो, share किए गए apps के लिए proxy support देता है
- abeyer: अगर authentik भी OIDC provider है, तो शायद उसे Tailscale authentication के लिए भी इस्तेमाल किया जा सकता है
Serenacula: मेरे पास एक script है जो input prompt लेकर नई script बनाती है, और फिर skills चलाकर धीरे-धीरे bugs की जाँच और सफ़ाई करती है
इसी से मैंने एक दूसरी script भी बनाई जो मेरी सारी custom scripts को सूचीबद्ध और ट्रैक करती है। एक tool भी है जो local scripts लोड करके CLI commands को किसी खास folder environment के हिसाब से scope करता है। कुल मिलाकर, जो भी चीज़ मुझे automatable लगती है, मैं उसे बनाकर इस्तेमाल कर रहा हूँ। मैं कभी इस पर blog post लिखना चाहता था, और हाल ही में पहली बार सच में महसूस हुआ कि personalized software की दुनिया ने वास्तव में सब कुछ बदल दिया है
neonglow: मैंने एक browser extension बनाया है जो डिफ़ॉल्ट रूप से GIF जैसी animated images के autoplay को रोक देता है
browser का animated images को autoplay करना हमेशा परेशान करता था, और अब तक इसका कोई built-in control नहीं है। यह extension पहली frame दिखाता है और image के ऊपर play/stop button जोड़ता है। यह एक personal utility के रूप में शुरू हुआ था, लेकिन मैंने इसे Firefox और Chrome extension stores पर भी डाल दिया। यह एक छोटा प्रोजेक्ट है जिसने मेरी रोज़ की समस्या हल की। Firefox: https://addons.mozilla.org/en-US/firefox/addon/gif-control/ Chrome: https://chromewebstore.google.com/detail/gif-control/nhoihin... bug reports और feedback का स्वागत है। मैंने इसे पहले Show HN पर भी पोस्ट किया था, लेकिन कोई प्रतिक्रिया नहीं मिली https://news.ycombinator.com/item?id=48208916
- xerox13ster: जब मैंने 2011 में पहली बार Linux को daily driver की तरह इस्तेमाल करना शुरू किया था, तब Konqueror, Firefox, LibreWolf और Opera का default behavior ऐसा ही था। autoplay करने के लिए flag चालू करना पड़ता था, और rendering area में autoplay video लोड करने के लिए click करने की warning आती थी। यह फीचर गायब हो गया, इसमें हैरानी नहीं है
- fc417fc802: इसकी वजह से शायद मैं eBay फिर से इस्तेमाल कर पाऊँगा। कुछ समय पहले उन्होंने कुछ product thumbnails में photo की जगह video की अनुमति देनी शुरू कर दी थी, इसलिए मैंने लगभग साइट browse करना ही छोड़ दिया था। आपने जो Show HN submission लिंक की है, वह dead के रूप में दिख रही है, इसलिए पता नहीं यह account issue है या नहीं; शायद HN moderators को mail करके देखना चाहिए
thatmf: मैंने vibe coding से एक छोटा web app बनाया, जिसे home screen पर install किया जा सकता है, और जो बताता है कि अगले दिन मेरी पहली meeting कब है
मेरी meetings बहुत होती हैं और वे लगातार बदलती रहती हैं, लेकिन मैं फोन पर work account में login नहीं करना चाहता और न ही उस दुनिया के बारे में सोचना चाहता हूँ। मुझे बस यह जानना है कि मुझे कब उठना है। ऐप केवल समय दिखाता है, और tap करने पर title देखा जा सकता है। meeting कितनी जल्दी है, इसके हिसाब से font और color भी बदलते हैं, और अगर वह सुबह 8 बजे से पहले हो तो Nosifer इस्तेमाल करता है। मैं इसे खुद बना सकता था, लेकिन शायद बनाता नहीं। मेरे हिसाब से ऐसे simple, ultra-specialized custom utilities vibe coding के लिए एकदम सही हैं
asciimoo: मैं online search engines और AI answers पर निर्भरता कम करने के लिए self-hosted search service Hister बना रहा हूँ https://hister.org/ https://github.com/asciimoo/hister
Hister websites और local files के लिए एक full-text indexer है, और browser द्वारा render किए गए visited pages को अपने-आप save कर लेता है। यह offline result previews और एक detailed query language के साथ web और terminal search interface देता है, और ज़रूरत पड़ने पर traditional search engines पर जल्दी जाने की सुविधा भी देता है। पहले देखे गए content को ढूँढने वाली “recall” search के लिए यह privacy-friendly experience देता है, लेकिन नए content की “discovery” search के लिए अभी भी कमजोर है
- SyneRyder: मेरा पहला AI project भी कुछ ऐसा ही था, लेकिन मैंने meta search से शुरुआत की थी। local index मैंने हाल ही में SQLite FTS 5 के साथ जोड़ा। मैंने अपना project public नहीं किया, लेकिन Hister की webpage वाकई शानदार है, और इसमें terminal interface के साथ MCP server भी है। काश ज़्यादा लोग समझते कि पहले देखे गए content के सिर्फ local search index भी कितने powerful हो सकते हैं। यह भी अच्छा होगा अगर और लोग बड़े indexes बनाएं, ताकि discovery search के alternatives के लिए सिर्फ Brave, Mojeek, Marginalia और EUSP पर निर्भर न रहना पड़े
hakunin: मैंने एक SQLite-आधारित sweeper बनाया है जो filesystem में मौजूद scanned documents, notes, PDFs और images को scan करके paths save करता है, और Mistral OCR द्वारा दी गई descriptions और text को searchable बनाता है
आप इससे “मुझे अपनी car की servicing कब करानी है?” या “मदर्स डे पर मेरे बच्चे ने जो drawing बनाई थी, वह ढूँढो” जैसे सवाल पूछ सकते हैं। मैं Raspberry Pi आधारित bash executable से इस तरह का document chat चलाता हूँ https://github.com/maxim/ringbinder
- nha1: मैंने भी ऐसा कुछ पूरी तरह offline बनाया था। मैंने इसे इसलिए शुरू किया क्योंकि मुझे tax filing करनी थी और जानकारी इकट्ठा करना बहुत मुश्किल हो रहा था
alphaBetaGamma: मैंने CAD में computer science और science-inspired jewelry design करने का एक tool बनाया
मैंने jewelry को represent करने के लिए एक DSL लिखा, और LLM से cadquery में CAD files generate करने वाला interpreter बनवाया। इससे यह सीख भी मिली कि LLMs 3D reasoning में कमजोर होते हैं। AI के बिना मैं शायद इसके लिए समय नहीं निकाल पाता। मैं frontend developer नहीं हूँ, इसलिए online store design करने में भी AI का इस्तेमाल किया, और यह देखकर हैरानी हुई कि मेरी पत्नी, जिसका technical background नहीं है, Claude Code से website modify कर पा रही थी। अंतिम नतीजा एक ऐसा store है जो Graham number की गणना करने वाले lambda diagrams (Tromp diagrams) या Y-combinator के करीब दिखने वाले fixed-point operator आकार की jewelry बेचता है। असली Y-combinator jewelry के नज़रिए से उतना सुंदर नहीं लगा https://studio-galois.com
- qiqitori: Gemini Pro ने हैरानीजनक रूप से 3D reasoning अच्छा किया। मैंने उससे एक WebGL program बनवाया जो WebSerial से हर 100ms पर आने वाले X123 Y123 Z123 जैसे input लेता है और path के रूप में objects बनाता है, और performance optimization भी सिर्फ निर्देश देने पर हो गया। उसने कई OpenSCAD models भी बनाए; उदाहरण के लिए, 5 slots, staggered heights और हल्का-सा tilted remote holder एक ही बार में बना दिया, और tilt को shear matrix से लागू किया
- 8note: 3D reasoning के लिए एक tip: उससे कई दिशाओं से बने चित्र एक साथ बनवाइए, फिर उनमें से एक चुन लीजिए। यह उस बहस से कहीं ज़्यादा समय बचाता है जिसमें आप Y-axis rotation कहते हैं और वह X-axis में घुमाने की व्याख्या करता रहता है
- phyzix5761: jewelry बहुत सुंदर है। जिज्ञासा है कि क्या इसकी कोई बिक्री हुई है
mybbor: agent-style coding के आम होने से पहले ही concert और music festival के लिए sticker design बनाता था। Sticker बनाकर बाँटना नए लोगों से मिलने का अच्छा तरीका था
OpenClaw से calories और alcohol को track करके personal dashboard में रिकॉर्ड करने वाला health·wellness coach agent भी बनाया। खाने की फोटो भेजो तो वह calories का अनुमान लगाकर रिकॉर्ड करता है, meal decisions में मदद करता है, और हौसला भी देता है। HAM dashboard repository https://github.com/VA3HDL/hamdashboard का इस्तेमाल करके local video और weather feeds को इकट्ठा करने वाला custom dashboard बनाया, और उसी rabbit hole में Sonoma County local radio reference guide भी बनाया https://mybbor.com/petaluma-sonoma-ham-radio.html। कई interests और projects के लिए one-off·small-scale websites भी लगभग 12 बनाई, और short-domain file uploader से Markdown और HTML को जल्दी host करके family·friends·colleagues के साथ share करना पसंद है। यह Caddy और DigitalOcean VPS पर चलता है, और code public है https://github.com/RobbyMcCullough/honeydrop
yablak: Google Takeout से ज़्यादा incremental Google Photos backup करने वाला tool बनाया https://github.com/ebrevdo/gphoto-pull
Google छोड़ने के बाद जिसकी कमी महसूस हुई, उसका IFTTT linter version भी बनाया https://github.com/ebrevdo/ifttt-lint
- s3graham: gphoto-pull देखकर अच्छा लगा। अब तक मैं आदिमानव की तरह हर दो महीने में NN वाले 50GB zip ले रहा था। अगर “Original” में backup करूँ, तो क्या यह byte-for-byte identical backup लाता है, यह जानना चाहता हूँ
jfim: बहुत सारे tools बनाए
extensible processing pipeline को support करने वाला self-hosted web archiving tool बनाया, जिसमें जैसे article extraction→translation→summary→tag generation, video download→audio separation→transcription→summary किया जा सकता है। इस दौरान extensions और WARC को support करने वाला managed Chromium browser भी बनाया, और RSS न होने वाले किसी भी article list page से feed बनाने वाला RSS synthesizer भी। native ads और sponsor blocks जैसी noise हटाकर article को साफ करने वाले model के लिए active learning loop भी है। एक tabbed terminal भी बनाया जिसमें database, app server, Claude Code को tab के हिसाब से एक साथ उठाया जा सकता है, और अगर terminal http://localhost:4000/ पढ़े तो browser अपने-आप सही URL खोल दे—ऐसी project management features भी हैं। Claude के साथ कुछ ही मिनटों में MCP server ideas जोड़कर deploy किए जा सकने वाला modular MCP server, MCP proxy और OAuth2 DCR भी हैं। Claude conversations को render करके Obsidian vault में convo://claude-code/-home-jfim-projects-foo/ जैसे links से जोड़ने वाला छोटा tool भी है, और कुल मिलाकर self-hosted environment में Docker container deployment के लिए इसका काफी उपयोग करता हूँ। ज़्यादातर चीज़ें GitHub पर हैं, लेकिन readiness अलग-अलग स्तर की है
- flutas: इनमें से कुछ दिलचस्प लग रहे हैं, आज रात देखूँगा
- seriocomic: लगता है हम काफ़ी मिलती-जुलती राह पर हैं। बस मैंने ज़्यादातर self-hosting को GitHub से हटाकर self-hosted Forgejo पर ले गया हूँ
joddystreet: कुछ चीज़ें बनाई हैं
self-hosted POPSQL alternative https://github.com/p-raj/collab-sqlc, open source tools पर आधारित CleanMyMac alternative https://github.com/p-raj/open-cleanmymac, standup meetings को comics में बदलने वाला tool https://github.com/p-raj/standup-to-comics, और configurable Pomodoro https://github.com/p-raj/open-tomato। कुछ private tools और भी हैं जो अभी काम करने की हालत के करीब भी नहीं हैं
- jmaw: जानना चाहता हूँ कि standup-to-comics से बने examples कहीं हैं क्या। Repository में नहीं दिखे, और खुद setup करने से पहले examples देखना चाहूँगा
- jsrcout: मैं standup-to-comics README पढ़ने के लिए तैयार नहीं था। Idea तो शानदार है ही, लेकिन इसने सोचने के लिए बहुत कुछ और कई नए rabbit holes भी दे दिए
SdtEE: Excel में CSV खोलने पर होने वाले हर तरह के अजीब व्यवहार से तंग आकर एक तेज़ और हल्का CSV viewer बनाना शुरू किया
बाद में पता चला कि arbitrary size के CSV files को तुरंत load करने की technique को incremental parser combinators के रूप में generalize किया जा सकता है, और इसे किसी भी format पर लगाया जा सकता है। इसलिए यह files ही नहीं, pipe जैसे stream-oriented sources भी पढ़ सकता है। Development में AI का इस्तेमाल किया, लेकिन intuitive और consistent UX design में इतना समय लगा कि speed gains ज़्यादा नहीं मिले। अभी production-ready नहीं है, लेकिन रुचि हो तो देख सकते हैं https://github.com/Verticalysis/Hitomi
AJRF: वह पल जब लगा “ये भी हो जाएगा, सोचा नहीं था” तब आया जब GLM 5 से Ubuntu के लिए Nintendo Switch Pro 2 Controller का user-space driver बनाया
Plug in करने पर device दिखता था, लेकिन button दबाते ही pairing process शुरू करने की कोशिश करता था, और evtest में कुछ नहीं आता था। वही description लगभग ज्यों-का-त्यों prompt था, और 10 मिनट बाद reboot के बाद भी काम करने वाली systemd unit सहित driver तैयार था। कमाल की बात है
josh_p: मैंने एक Telegram bot बनाया है जो सुबह और दोपहर में लगभग एक तरह की to-do list भेज देता है। यह Google Calendar और एक जुगाड़ू memory database (SQLite) से जुड़ा है, और बच्चों ने कहा था कि यह Silksong के Yarnaby की तरह बोले
मैंने Steam saves का auto-backup भी बनाया, ताकि जब बच्चे मेरे account से वही game खेलते हुए Steam Cloud saves गड़बड़ा दें तो काम आए। flaky tests वाले repositories में failed GitHub Actions को auto-rerun करने वाला script भी बनाया। ऐसा उपयोग है जहाँ लगता है, क्या इसे सच में ठीक करने की ज़रूरत है? branches को अपने-आप main के साथ catch up भी करवाता है। एक YNAB extension भी है, pi agent harness के लिए, जो उन purchase inputs में मदद करता है जिन्हें categories में बाँटना होता है; इसे Telegram bot में डालकर voice input से purchases समझाई जा सकती हैं। पहले से मेरे पास Magic: The Gathering proxy printing के लिए PDF generate करने वाला Python script था, और LLM से set names और symbols वाले divider pages बनवाकर बड़े card boxes को organize करना आसान हो गया
geedy: मैं शुरू से एक BRep CAD kernel बना रहा हूँ
अगर fillets बहुत अच्छी तरह काम करने लगे, तो इसे open source करने का इरादा है। इसमें थोड़ा समय लगेगा, लेकिन 10 हफ्ते पहले शुरू करने के बाद से काफ़ी प्रगति हुई है। मध्यम अवधि का लक्ष्य एक GUI app निकालना है जो STEP files import करके सिर्फ़ बहुत high-quality fillets को process कर सके। लगता है कि यह कई hobby users के लिए उपयोगी होगा
- mym1990: मैं अभी CAD सीखना शुरू ही कर रहा हूँ, इसलिए यह जानने की जिज्ञासा है कि “बहुत high-quality” fillet क्या होता है
smeej: मैं काफ़ी समय से Logseq इस्तेमाल कर रहा हूँ, और अच्छी बात यह है कि Logseq और उसके plugins दोनों open source हैं
मैं अक्सर इस्तेमाल होने वाले plugins को clone करके “Claude, इसमें X भी कर दो” कहता हूँ, और इस तरह लंबे समय से चाही गई सुविधाएँ जोड़ने में बहुत मज़ा आता है
mike-cardwell: https://gitlab.com/grepular/calendiff .ics URL को monitor करता है और calendar changes के बारे में email भेजता है
https://gitlab.com/grepular/foxcage Firefox को podman के अंदर चलाता है ताकि वह host से isolate रहे, और उसमें सिर्फ़ वे कुछ features डाले हैं जो मैं चाहता था। https://gitlab.com/grepular/claude-sandbox एक और Claude sandbox है, यह भी podman के अंदर चलता है और credentials की सुरक्षा के लिए एक मज़बूत proxy system रखता है। अभी मैं एक email sanitization tool पर काम कर रहा हूँ, और जब यह इतना ठीक हो जाएगा कि दूसरे लोग भी इस्तेमाल कर सकें, तब https://www.grepular.com/blog/ पर इसके बारे में लिखूँगा। यह HTML/SVG/calendar/vcard हिस्सों पर policies लागू करता है ताकि tags, attributes, CSS और URL schemes को allow/block किया जा सके, URLs को साफ़ किया जा सके, tracking रोकने के लिए remote content को delivery के समय fetch करके email में attach किया जा सके, और PGP तथा S/MIME की automatic encryption/decryption समेत बहुत सी सुविधाएँ देता है
eternityforest: मैंने yjs के साथ एक inventory tracking app बनाया था जो सिर्फ़ browser में चलता है और peer.js से sync होता है, लेकिन आजकल मैं इसका ज़्यादा उपयोग नहीं करता https://eternityforest.github.io/Stuffer/
app तो नहीं, लेकिन एक productivity system भी है। जब भी मैं कुछ भूलता हूँ, मैं AI को उसके बारे में बताता हूँ, और उस खास गलती से जुड़ी human error research references माँगते हुए उसे थोड़ा-थोड़ा refine किया है https://github.com/EternityForest/THUNDERWARS
david_shi: पिछले 3 महीनों में मैंने cloud में नए OpenClaw agents को बहुत तेज़ी से set up करने का तरीका बनाया है https://operator.io
Telegram के भीतर कई isolated agents चलाना, जिनकी अपनी memory और tasks हों, notifications automation, context tracking, और एक personal external cortex की तरह काफ़ी अच्छा रहा
flutas: मैंने एक Home Agent setup बनाया है, और Home Assistant के ज़रिए घर के अलग-अलग पहलुओं को manage करने वाले custom specialized agents हैं
यह घर के users के feedback से सीखकर सही समय पर चीज़ों को adjust करने की कोशिश करता है। इससे जुड़े कई MCP भी बनाए हैं। एक remote Claude Code server भी है, जो project-level overview देखकर laptop local की बजाय home server पर projects चलाने और develop करने देता है। यह SSH और web UI दोनों support करता है, और web UI में project list, https://xtermjs.org/ से render किया गया shell, और कई projects पर काम करते समय turn completion दिखाने वाला tiled overview है। इसी तरह local version project-scoped podman containers को अपने-आप start करता है, working directory पास करता है, CC/Codex/Grok install करता है, हर agent की auth/config आगे देता है, और फिर permissions prompts बंद करने वाले environment flags और aliases वाले shell में ले जाता है। उदाहरण के लिए, claude = claude --dangerously-bypass-permissions। Obsidian की advanced features, plugin suggestions/installation/configuration आदि तक agents की पहुँच देने वाला एक बहुत बड़ा MCP भी है। इससे रोज़मर्रा की productivity में मदद मिली है, लेकिन ज़्यादातर मामलों में मैं अब भी हर चीज़ prompt से करवाने के बजाय सीधे code में हाथ डालना पसंद करता हूँ
- nzach: जानना चाहूँगा कि क्या आप Home Agent से जुड़ा code या insights साझा कर सकते हैं। मैं कुछ ऐसा ही बनाना चाहता हूँ—एक digital butler, जो घर में क्या हो रहा है उस पर नज़र रखे, dead या unstable devices के बारे में बताए, टूटी हुई automations को ठीक करे, और sensor data के आधार पर नई automations सुझाए। मैंने unofficial Home Assistant MCP set up किया है, लेकिन लगता है LLM उसे ठीक से इस्तेमाल करने में थोड़ा संघर्ष करता है, इसलिए अभी तक मैंने वजह की गहराई से जाँच नहीं की
danielvaughn: मैं designers के लिए एक browser बना रहा हूँ। यह दूसरों के लिए भी है, लेकिन मुख्य रूप से मैं इसे अपने लिए बना रहा हूँ
मैं code के साथ काम करता हूँ, लेकिन कई बार ideas explore करने के लिए branches नहीं बनाना चाहता, न ही codebase में demo components और files का बिखराव करना चाहता हूँ। अगर एक सामान्य browser में developer tools होते हैं, तो इस browser में design tools built-in हैं। आप app पर जाते हैं, आसपास का canvas खोलते हैं, टुकड़ों को canvas पर खींचकर design-जैसा काम करते हैं, और फिर उसे वापस code में merge कर सकते हैं। यह सब एक ही UI में होता है। यह इतना अच्छा बन रहा है कि मैं इसे public करूँगा, लेकिन अभी भी यह मेरे लिए बहुत उपयोगी है https://matry.design/
margarita_dev: शुरू से ही जिन चीज़ों को बनाकर देखना चाहता था, उनकी सूची में हमेशा एक programming language रही, और AI की मदद से उसे पूरा कर लिया।
कंपनी में AI workflow और skill library की दो बड़ी समस्याएँ दिखीं। जब पूरा workflow 100-step Markdown file हो, तो determinism की कमी होती है, और Markdown skill library में composability कम होती है, जिससे DRY का उल्लंघन होता है। Margarita, Markdown और logical operators को साथ रहने देती है, ताकि ज़रूरत पड़ने पर code structure से determinism लाई जा सके और आवश्यकता होने पर LLM dynamic code पर जाया जा सके। इसके अलावा, यह React जैसी composable prompts की अनुमति देती है, जिससे text के इधर-उधर बिखरे होने वाली skill library की समस्या भी हल होती है। Reddit पर प्रतिक्रिया ठंडी रही, इसलिए शायद इसे बंद कर दूँ, लेकिन इसे बनाने की प्रक्रिया बहुत मज़ेदार थी। लगभग सभी LLM providers के लिए code agents बनाए और अपना harness भी बनाया; सीखने के लिए यह बहुत अच्छा अनुभव था, इसलिए इसकी सिफारिश करूँगा। https://www.margarita.run https://github.com/Banyango/margarita
- vibcdingenjoyer: मेरी समझ बहुत गहरी नहीं है, इसलिए जानना चाहता हूँ कि क्या इसे किसी उदाहरण या use case से समझा सकते हैं?
jtap: अपनी बेटी, दोस्तों और खुद के लिए Pokemon card scan/index tool बनाता रहा हूँ https://MyBulkCards.com
यह एक mobile app और website से मिलकर बना है, और app कैमरे से कार्ड स्कैन करके images को कुछ models से गुजारता है, फिर card और उसकी location history सेव करता है। यह बुनियादी है, लेकिन “Box 1 AAA, Box 1 BBB …” जैसी box locations सेव कर सकता है, जिससे कार्ड आसानी से मिल जाते हैं। इसमें friends feature भी है, इसलिए आसपास के दोस्त कौन-से कार्ड रखते हैं यह देखा जा सकता है, और हम अक्सर आपस में कार्ड उधार लेते हैं। इसे बनाना सचमुच बहुत मज़ेदार रहा, और अभी-अभी Android app store approval मिला है। थोड़ा और व्यवस्थित करने के बाद इसे जल्द ही सार्वजनिक करूँगा।

cychong 2026-06-10

मैं Photo app में तस्वीरें चुनकर hugo का इस्तेमाल करने वाले अपने पर्सनल ब्लॉग के लिए पोस्ट लिखता हूँ, और इसमें ज़रूरी ये प्रक्रियाएँ

तस्वीरों को मनचाहे size में export करना
export की गई तस्वीरों को hugo blog के image folder में ले जाना
तस्वीरों के links शामिल करते हुए markdown draft बनाना
ब्लॉग का main text जोड़ना
git commit करना
जैसे काम काफ़ी झंझट वाले थे, इसलिए मैंने इस काम में मदद करने के लिए एक tool बनाकर इस्तेमाल करना शुरू किया है.

इसके साथ मैंने एक feature भी जोड़ा है जो यात्रा से लौटने के बाद खींची गई बहुत-सी तस्वीरों को समय और स्थान के आधार पर sort करके ठीक तरह से group कर देता है, ताकि उनसे ब्लॉग पोस्ट लिखी जा सके. इस वजह से यह यात्रा के रिकॉर्ड सहेजने में भी काफ़ी काम आता है.

Ask HN: AI के आने के बाद, आपने अपने लिए कौन-से टूल बनाए हैं?

डेवलपर्स ने जो बदलाव महसूस किया

संबंधित पढ़ाई

8 टिप्पणियां

Hacker News की राय