डुप्लिकेट फ़ाइलें और यह बताने वाला डिस्क स्कैनर LLM diskscan कि मैं किस प्रकार का उपयोगकर्ता हूँ
(argo9.com)प्रकाशन उद्योग में काम करते समय सबसे कठिन काम फ़ाइलों और फ़ोल्डरों को व्यवस्थित करना है. अक्सर एक ही प्रोजेक्ट को कई फ़ोल्डरों में कॉपी करके काम आगे बढ़ाया जाता है, इसलिए सिर्फ़ मेरे ही नहीं बल्कि कर्मचारियों की डिस्क पर भी वही फ़ोल्डर बड़ी संख्या में बन जाते हैं.
इसे मैंने 1 साल पहले Python में बनाया था, फिर Go whails से ऐप के रूप में बनाया, और इस बार Rust में उस फ़ंक्शन को और उन्नत करके तैयार किया है. साथ ही, फ़ाइल फ़ॉर्मैट और hidden files को देखकर यह भी रिपोर्ट करता है कि आप किस तरह के डिस्क उपयोगकर्ता हैं.
Mac, Windows, Linux, NAS, cloud में मौजूद डुप्लिकेट फ़ाइलों और प्रोजेक्ट्स की तुलना करके यह बताता है कि कौन-सी फ़ाइल एक जैसी है, कौन-सा version नया है, और काम की फ़ाइलों में मौजूद अनावश्यक ._ जैसी फ़ाइलों को हटा देता है.
यह डिस्क-स्तर पर डुप्लिकेट तुलना और रिपोर्ट करता है, और hash के आधार पर मूल फ़ाइलों की तुलना करता है.
डिस्क फ़ाइलों को देखकर विश्लेषण करने की सुविधा है और यह भी रिपोर्ट देता है कि आप कौन-से नए काम या प्रोजेक्ट पर काम कर रहे हैं. यह एक local program है, और आप Ollama, LMStudio जैसे local LLM या GeminiAPI, OpenAI API में से चुन सकते हैं.
डाउनलोड
Mac
https://drive.google.com/file/d/…
Windows install
1 टिप्पणियां
हैश-आधारित तरीके से duplicate files को व्यवस्थित करना एक स्थिर approach लगता है.
मैंने भी काम के दौरान इसी तरह की समस्या झेली है,
जहाँ file name एक जैसा होने पर भी असली content अलग होता था, या
बीच में बनने वाली working files (
.tmp,._आदि) मिल जाती थीं, इसलिएसिर्फ simple comparison से ठीक से सफाई नहीं हो पाती थी.
LLM के ज़रिए user type तक report करने वाला हिस्सा दिलचस्प है,
लेकिन यह report किन मानदंडों के आधार पर बनाई जाती है?
उदाहरण के लिए, क्या यह file structure या extension distribution के आधार पर बनती है, यह जानने की जिज्ञासा है.