फ़ाइलसिस्टम पर फिर से ध्यान क्यों जा रहा है

(madalitso.me)

36 पॉइंट द्वारा GN⁺ 2026-03-09 | 1 टिप्पणियां | WhatsApp पर शेयर करें

हाल में AI एजेंट इकोसिस्टम में फ़ाइलसिस्टम पर फिर से ध्यान गया है, और यह डेटाबेस से अलग स्थायी context management के साधन के रूप में उभर रहा है
LLM का context window स्थायी memory नहीं, बल्कि मिटते रहने वाले whiteboard के अधिक करीब है, और फ़ाइलसिस्टम इसका सबसे सरल स्थायी storage समाधान है
Claude Code, Cursor आदि फ़ाइल-आधारित context storage के ज़रिए long-term memory लागू करते हैं, और CLAUDE.md, aboutme.md जैसी फ़ाइलें एजेंट की पहचान और environment information को संजोने का काम करती हैं
फ़ाइलसिस्टम-आधारित context management एक प्रमुख विषय के रूप में उभरा है, और LlamaIndex·LangChain·Oracle·Archil जैसी प्रमुख कंपनियों ने इससे जुड़े लेख और प्रोडक्ट लगातार जारी किए हैं
CLAUDE.md, AGENTS.md, .cursorrules जैसी agent context files के फैलाव के बीच, Anthropic का Agent Skills(SKILL.md) फ़ॉर्मैट Microsoft·OpenAI·GitHub·Cursor आदि द्वारा अपनाया गया है, जिससे interoperability मिली है
ETH Zürich के शोध के अनुसार context files उल्टा task success rate को घटा सकती हैं और inference cost को 20% से अधिक बढ़ा सकती हैं, इसलिए इनमें केवल न्यूनतम आवश्यकताएँ ही लिखनी चाहिए
फ़ाइलें किसी एक खास app पर निर्भर नहीं होतीं, और AI एजेंट युग में टूल्स के बीच स्विचिंग, workflow संयोजन और continuity बनाए रखने वाली open interface के रूप में स्थापित हो रही हैं

Everyone is talking about files : हर जगह फ़ाइलों की चर्चा हो रही है

LlamaIndex ने "Files Are All You Need" प्रकाशित किया, और LangChain ने एजेंट फ़ाइलसिस्टम का उपयोग context engineering के लिए कैसे कर सकते हैं पर चर्चा की
Oracle (हाँ, वही Oracle!) ने फ़ाइलसिस्टम और डेटाबेस के बीच agent memory management की तुलना पर लेख प्रकाशित किया, जबकि Dan Abramov ने AT Protocol आधारित social filesystem का प्रस्ताव रखा
Archil क्लाउड वॉल्यूम बना रहा है क्योंकि एजेंट POSIX filesystem चाहते हैं
LlamaIndex के Jerry Liu का कहना है कि "सैकड़ों टूल्स वाले एक एजेंट" की बजाय, केवल फ़ाइलसिस्टम और 5~10 टूल्स के साथ बना एजेंट 100 से अधिक MCP tools वाले एजेंट से भी ज़्यादा सामान्य-उपयोगी हो सकता है
Karpathy ने कहा कि Claude Code के काम करने की वजह यह है कि वह सीधे उपयोगकर्ता के कंप्यूटर, environment, data और context पर चलता है; और OpenAI का cloud container deployment पर फोकस करना गलत दिशा थी
फिलहाल coding agents वास्तविक AI उपयोग मामलों का बड़ा हिस्सा बनाते हैं, और Anthropic का CLI tool Claude Code उसकी कमाई का बड़ा भाग चला रहा है, जिससे कंपनी मुनाफ़े के करीब पहुँच रही है

Context window memory नहीं है

इंसानी memory में long-term storage, selective recall और गैर-ज़रूरी जानकारी भूलने की क्षमता शामिल होती है, लेकिन LLM का context window लगातार मिटते रहने वाले whiteboard जैसा है
Claude Code इस्तेमाल करते समय जब "context left until auto-compact" अलर्ट करीब आता है, तो एजेंट द्वारा संचित codebase, preferences और decisions जैसे context compress हो जाते हैं या खो जाते हैं
फ़ाइलसिस्टम इसका सबसे सरल समाधान देता है: चीज़ों को फ़ाइल में लिखो, और ज़रूरत पड़ने पर फिर पढ़ो
- CLAUDE.md प्रोजेक्ट के लिए स्थायी context देता है
- Cursor पुराने chat records को searchable files के रूप में सहेजता है
- aboutme.md preferences, skills और working style को रखने वाला portable identity descriptor बनता है, जो API coordination के बिना apps के बीच जा सकता है

ETH Zürich का शोध: context files का paradox

ETH Zürich के हालिया पेपर ने यह आंका कि repository-level context files वास्तव में coding agents की task completion में मदद करती हैं या नहीं
नतीजे उल्टे साबित हुए: कई एजेंटों और मॉडलों में context files ने task success rate घटाई, और inference cost 20% से अधिक बढ़ाई
- context files पाने वाले एजेंटों ने ज़्यादा व्यापक खोज की, ज़्यादा tests चलाए, और ज़्यादा files देखीं, लेकिन जिन कोड हिस्सों में बदलाव चाहिए था, वहाँ पहुँचने में देर हुई
- ये फ़ाइलें एजेंट के लिए ऐसे checklist की तरह काम करने लगीं जिन्हें वह ज़रूरत से ज़्यादा गंभीरता से फॉलो करता है
पेपर का निष्कर्ष यह नहीं है कि "context files का उपयोग मत करो", बल्कि यह कि गैर-ज़रूरी requirements task को कठिन बना देती हैं, इसलिए context files में केवल न्यूनतम requirements ही लिखनी चाहिए
समस्या फ़ाइलसिस्टम की स्थायी परत में नहीं, बल्कि CLAUDE.md को 2,000 शब्दों के onboarding document की तरह लिखने की आदत में है

फ़ाइल फ़ॉर्मैट ही API है — लेकिन कौन-सी फ़ाइल?

अभी CLAUDE.md, AGENTS.md, copilot-instructions.md, .cursorrules साथ-साथ मौजूद हैं; एजेंटों को स्थायी फ़ाइलसिस्टम-आधारित context चाहिए, इस पर सहमति है, लेकिन फ़ाइल नाम और content format पर सहमति नहीं है
Dan Abramov के social filesystem लेख में मुख्य डिज़ाइन यह है: AT Protocol user data को private repository के भीतर files की तरह मानता है, और apps को "post" क्या है इस पर सहमत होने की ज़रूरत नहीं होती, क्योंकि domain-name आधारित namespace टकराव रोक देता है
- हर app का database derived data बन जाता है, यानी हर user folder का cached materialized view
Anthropic ने Agent Skills को open standard के रूप में पेश किया: SKILL.md फ़ॉर्मैट को Microsoft, OpenAI, Atlassian, GitHub, Cursor ने अपनाया
- Claude Code के लिए लिखी गई skill, Codex और Copilot पर भी चलती है — फ़ाइल फ़ॉर्मैट ही API है
NanoClaw एक lightweight personal AI assistant framework है, जो "features की जगह skills" मॉडल अपनाता है
- अगर Telegram support चाहिए, तो Telegram module नहीं बल्कि /add-telegram skill (एक Markdown फ़ाइल) Claude Code को सिखाती है कि उसे कैसे इंटीग्रेट करना है
- skills फ़ाइलें होने की वजह से portable, auditable और composable हैं — MCP server या plugin marketplace की ज़रूरत नहीं
यही है coordination-free interoperability: अगर दो apps Markdown पढ़ सकते हैं, तो वे context साझा कर सकते हैं; अगर वे SKILL.md फ़ॉर्मैट समझते हैं, तो functionality भी साझा कर सकते हैं; partnership agreements या standardization meetings के बिना, फ़ाइल फ़ॉर्मैट खुद coordination का काम करता है

Bottleneck का स्थान बदल रहा है

पारंपरिक data architecture इस धारणा पर बनी थी कि storage bottleneck है, लेकिन जब processing क्षमता storage I/O से आगे निकल गई, तो storage और compute के separation (S3 + temporary compute clusters) की ओर paradigm shift हुआ
AI एजेंटों में भी ऐसा ही हो रहा है: bottleneck model performance या compute नहीं, बल्कि context है
- models पर्याप्त स्मार्ट हैं, लेकिन भूलक्कड़ हैं
- फ़ाइलसिस्टम, ठीक वहीं जहाँ एजेंट चलता है (डेवलपर की मशीन, environment, data जहाँ पहले से मौजूद हैं), स्थायी context को manage करने का सबसे प्रभावी तरीका है

फ़ाइलसिस्टम पहले से ही graph है

Twitter पर यह बात उठी कि जो लोग फ़ाइलसिस्टम का उपयोग करते हुए कहते हैं कि एजेंटों को graph की ज़रूरत नहीं, वे असल में इस बात से इनकार कर रहे हैं कि वे graph का ही उपयोग कर रहे हैं
- फ़ाइलसिस्टम directories, subdirectories और files से बना tree structure है, यानी एक directed acyclic graph (DAG)
- जब एजेंट ls, grep, फ़ाइल पढ़ना, और references follow करना करते हैं, तब वे पहले से graph traverse कर रहे होते हैं
Oracle के लेख में Richmond ने सबसे तेज़ भेद बताया: फ़ाइलसिस्टम interface के रूप में जीतता है, और database foundation layer के रूप में जीतता है
- जब concurrent access, large-scale semantic search, deduplication, freshness weighting जैसी ज़रूरतें आती हैं, तो अंततः अपना index बनाना पड़ता है, जो व्यवहार में database ही है
फ़ाइल interface इसलिए शक्तिशाली है क्योंकि यह universal है और LLM इसे पहले से समझते हैं; database-backed layer इसलिए शक्तिशाली है क्योंकि यह वास्तविक संचालन के लिए ज़रूरी guarantees देती है
भविष्य फ़ाइल बनाम database का नहीं, बल्कि ऐसी संरचना का है जहाँ फ़ाइलें इंसानों और एजेंटों के interaction का interface हों, और नीचे use case के मुताबिक foundation layer हो

यह personal computing की पुनर्परिभाषा है

फ़ाइलसिस्टम AI युग में personal computing के अर्थ को फिर से परिभाषित कर सकता है
- data, context, preferences, skills और memory ऐसे फ़ॉर्मैट में मौजूद हों जो उपयोगकर्ता के स्वामित्व में हों, जिन्हें कोई भी एजेंट पढ़ सके, और जो किसी एक application में lock-in न हों
- aboutme.md आज के OpenClaw/NanoClaw में भी काम करता है, और कल के नए टूल्स में भी
- skill files portable हैं, और project context टूल्स के पार भी बना रहता है
यह वैसा ही है जैसा personal computing मूल रूप से होना चाहता था, इससे पहले कि सब कुछ closed SaaS apps और proprietary databases की ओर चला जाए
- फ़ाइलें मूल open protocol हैं, और जब AI एजेंट computing का मुख्य interface बन रहे हैं, तब वे tools switching, workflow संयोजन, और applications के बीच continuity को किसी की अनुमति के बिना संभव बनाती हैं
फिर भी इसमें आदर्शवाद का पहलू है: open formats के इतिहास में कई ऐसे standards हैं जो कागज़ पर जीते, लेकिन व्यवहार में असफल रहे
- कंपनियों के पास अपनी context files को थोड़ा अलग बनाने का प्रोत्साहन होता है, ताकि switching cost बनी रहे
- CLAUDE.md, AGENTS.md और .cursorrules का एक universal format में एकीकृत न होना, बल्कि साथ-साथ बने रहना, यह दिखाता है कि fragmentation default है
- ETH Zürich का पेपर याद दिलाता है कि फ़ॉर्मैट होने के बावजूद अच्छी context files लिखना कठिन है, और खराब context files न होने से भी बदतर हो सकती हैं
Dan Abramov का मुख्य संदेश:

हमारी memories, thoughts और designs उन्हें बनाने वाले software से अधिक समय तक जीवित रहने चाहिए
- यह तकनीकी तर्क नहीं, बल्कि मूल्य का प्रश्न है; और फ़ाइलसिस्टम इस भूमिका के लिए इसलिए उपयुक्त है क्योंकि वह सबसे बेहतरीन तकनीक नहीं, बल्कि पहले से उपयोगकर्ता की अपनी एकमात्र तकनीक है

1 टिप्पणियां

GN⁺ 2026-03-09

Hacker News की राय

फ़ाइलें स्वतंत्रता का एक बुनियादी रूप हैं, जो उपयोगकर्ताओं को अपने डेटा का सीधा स्वामित्व देती हैं
इससे गोपनीयता, अखंडता और उपलब्धता पर संप्रभुता संभव होती है
डिजिटल स्वतंत्रता के एक मुख्य स्तंभ के रूप में, इन्हें FOSS लाइसेंस के बराबर माना जाना चाहिए
- LLM की reasoning क्षमता की वजह से अब फ़ाइल संरचना की उतनी चिंता नहीं करनी पड़ती
  प्राकृतिक भाषा खुद फ़ाइल के भीतर मौजूद हो सकती है, और पठनीयता ही स्पेक बन जाती है
  जो भी इंसान आसानी से पढ़ सकता है, वह फ़ाइल में लिख भी सकता है, और उसे REPL की तरह तुरंत चलाया जा सकता है
- इसलिए Apple जैसी बड़ी tech कंपनियों का फ़ाइल की अवधारणा को मिटाने की कोशिश करना असहज लगता है
  वे डेटा को apps से बाँध देती हैं ताकि वह स्वतंत्र रूप से मौजूद न रह सके, और import/export भी मुश्किल हो जाता है
  मैं इस समस्या को हल करने के लिए backups से डेटा को सूक्ष्म फ़ाइल इकाइयों में निकालकर एक व्यक्तिगत digital library में ले जाने वाला tool बना रहा हूँ
  immutable data के लिए archival काफ़ी है, लेकिन editable data को फिर से ‘जीवित’ रूप में apps में संपादन योग्य बनाना सबसे बड़ी चुनौती है
- मुझे लगता है कि config files, Windows Registry जैसे केंद्रीकृत storage से कहीं बेहतर हैं
  अस्थायी बदलाव और sharing आसान होती है, और settings का अर्थ साफ़ तौर पर परिभाषित रहता है
  Windows का फ़ाइलों को तीसरे दर्जे के नागरिक की तरह ट्रीट करना मुझे पसंद नहीं है
SaaS के नज़रिए से भी मैं यही सोचता हूँ
जितना code अस्थायी और domain-specific होता है, उतना ही data (फ़ाइलें) मानक और लगभग उबाऊ स्तर तक स्थिर होना चाहिए
ऐसे formats जिन्हें सिर्फ़ कोई खास app पढ़ सके, तकनीकी कर्ज़ हैं और अंत में प्रोजेक्ट को बर्बाद कर देते हैं
1995 की JPEG फ़ाइल आज भी खुल जाती है, क्योंकि वह किसी एक software पर निर्भर नहीं है
- मेरा 10 साल से भी पुराना photo management system, file system और EXIF को source of truth मानता है
  यह कई बार साबित हो चुका सही तरीका है
  Google Photos या Immich जैसी abstraction layers सिर्फ़ सुविधा के लिए हैं, असली चीज़ फ़ाइलें ही हैं
  काम में भी मैं research और documents को markdown और csv फ़ाइलों से मैनेज करता हूँ
  elodie project link
- आजकल photo management की समस्या यह है कि edits, tags और album information सब external metadata में स्टोर होती है
  platform बदलते ही सारी edit history ग़ायब हो जाती है
  undo फ़ीचर सुविधाजनक है, लेकिन मैं चाहता हूँ कि ऐसे बदलाव portable रूप में standardize किए जाएँ
मैं Bell Labs के Plan 9 का ज़िक्र करना चाहूँगा
Plan 9 from Bell Labs
- मैं agenc नाम का एक agent orchestrator बना रहा हूँ
  मैंने Claude से prior art के बारे में पूछा तो उसने Plan 9 सुझाया, और यही वह अवधारणा है जिसकी हमें अभी ज़रूरत है
  agents के लिए न्यूनतम permissions की philosophy, enterprise security model जैसी ही है
  बस Plan 9 बहुत जल्दी आ गया था
- नए file systems में GeFS को देखना चाहिए
इससे फिर महसूस होता है कि Plan 9 और UNIX सही थे
सबसे शक्तिशाली interface, file system के ऊपर मौजूद text files हैं
अब 9p2026 को फिर से बनाने का समय है
लेकिन लेख के कुछ बुनियादी विचार ग़लत हैं — file system tree नहीं बल्कि चक्र बना सकने वाला graph है
- मैं जानना चाहता हूँ कि Plan 9 की मुख्य capabilities क्या हैं, क्या उन्हें FUSE से जोड़ा जा सकता है, या फिर कोई और गहरी जादूगरी चाहिए
यह बात मुझसे भी गहराई से जुड़ती है
पिछले 1 साल में मैंने 10 से ज़्यादा SaaS से अपना व्यक्तिगत data एक ही directory structure में शिफ्ट किया है
संगठित file system एक single user के लिए काफ़ी है, और data fragmentation को खत्म कर देता है
आगे शायद ऐसे नए databases आएँगे जो file system को opaque बनाए बिना सुरक्षित multi-user writes को support करेंगे
यह कुछ-कुछ वैसा लगता है जैसा search के लिए QMD करता है
अभी AI का उपयोग अभी भी अपरिपक्व चरण में है
production systems तो consistent और scalable data structures पर चलेंगे, लेकिन उन्हें बनाने वाले agents file system आधारित technology इस्तेमाल करेंगे
UI डेस्कटॉप से आगे बढ़कर voice और visual interfaces की ओर विकसित होगा
उदाहरण के लिए, video call में चेहरे के हाव-भाव और आवाज़ के उतार-चढ़ाव को पढ़कर ज़्यादा context लेना
- हाल ही में देखे गए AI demo video में आवाज़ और हाव-भाव से context निकालकर उसे text में बदलकर फिर LLM को दिया जाता है
  यह पूरी तरह multimodal नहीं है, लेकिन बहुत दिलचस्प था
- फिर भी text input शायद गायब नहीं होगा
  लिखना सोच को व्यवस्थित करता है, और बोलने जितना तात्कालिक नहीं होता
  speech recognition (STT) कितना भी अच्छा हो जाए, मानव बुद्धि अब भी लेखन-केंद्रित तरीके से काम करती है
फ़ाइलें तभी उपयोगी हैं जब उन्हें ढूँढा जा सके
यानी search और index अनिवार्य हैं, लेकिन scale बढ़ने पर यही टूटने लगते हैं
इसलिए मुख्य सवाल है: ‘agents जिस knowledge base को संभालेंगे, उसका आकार कितना होगा?’
मैंने इस विषय का first principles से विश्लेषण “a good agentic KB” लेख में किया है
codebase जैसी अच्छी तरह व्यवस्थित कई फ़ाइलों में coding agents जानकारी अच्छी तरह ढूँढ लेते हैं
लेकिन बिखरे हुए data को file system में व्यवस्थित करना कहीं अधिक कठिन है
यह vector DB में semantic search करने से भी ज़्यादा जटिल है
codebase, DRY सिद्धांत की वजह से स्वाभाविक रूप से graph structure बनाए रखता है, लेकिन non-code data ऐसा नहीं करता
इसलिए मैं मानता हूँ कि लंबे समय में file system एक अच्छा context structure है, लेकिन अभी वह search को पूरी तरह replace नहीं कर सकता
मुझे लगता है file system एक घटिया abstraction है
directory tree जैसी एक जानबूझकर बनाई गई संरचना पर फ़ाइलों को टाँगना अकुशल है
relational model या unique identifier आधारित structure बेहतर लगता है
- file system का फ़ायदा बदलाव की locality को बचाए रखना है
  एक branch में हुए बदलाव दूसरी branch को प्रभावित नहीं करते
  जबकि database में UPDATE या DELETE पूरे सिस्टम को प्रभावित कर सकते हैं, इसलिए वे जोखिमभरे हैं
  इसी वजह से modern OS की तरह tree structure पर DB index चढ़ा हुआ hybrid मॉडल आदर्श लगता है
- NTFS अंदरूनी रूप से MFT database का उपयोग करता है
  वह file names को b+tree से index करता है, और file data भी MFT में स्टोर करता है
  directories बस ऐसी rows हैं जिनमें ‘directory=true’ attribute होता है
  WinFS जैसा पूरी तरह relational approach performance समस्याओं के कारण असफल हुआ, और उसकी जगह Skydrive ने ले ली
- ज़्यादातर file systems में फ़ाइलें inode के ज़रिए unique identify की जाती हैं, और कई links से refer की जा सकती हैं
  लगता है लोग इस बात को अक्सर भूल जाते हैं
- UUID इंसानों के लिए opaque है, लेकिन agents के लिए बिल्कुल स्पष्ट पहचानकर्ता है
  अंततः दिशा शायद S3-style blob storage पर अच्छे indexes चढ़ाने की होगी, और directories टैग्स की तरह on-demand generate होंगी
  यानी सिर्फ़ “Q3 से संबंधित सामग्री इस directory में है” जैसी grouping functionality बचेगी

फ़ाइलसिस्टम पर फिर से ध्यान क्यों जा रहा है

Everyone is talking about files : हर जगह फ़ाइलों की चर्चा हो रही है

Context window memory नहीं है

ETH Zürich का शोध: context files का paradox

फ़ाइल फ़ॉर्मैट ही API है — लेकिन कौन-सी फ़ाइल?

Bottleneck का स्थान बदल रहा है

फ़ाइलसिस्टम पहले से ही graph है

यह personal computing की पुनर्परिभाषा है

संबंधित पढ़ाई

1 टिप्पणियां

Hacker News की राय