11 पॉइंट द्वारा GN⁺ 2024-12-16 | 3 टिप्पणियां | WhatsApp पर शेयर करें
  • Buzee एक full-text search application है, जिसे Mac और Windows पर इस्तेमाल किया जा सकता है
  • यह ऐसा टूल है जो यूज़र को सभी documents, images, audio, video, folders और browser history में तेज़ Full-Text search करने देता है
  • keywords, समय, type या इनके combination के आधार पर local documents और folders खोजे जा सकते हैं
  • किसी विशेष file या folder को indexing से बाहर रखा जा सकता है, या केवल उसका content बाहर रखा जा सकता है
  • global shortcut का उपयोग करके app को दिखाया/छिपाया जा सकता है (⎇ / Alt + Space)
  • app के अंदर तुरंत search पर जाएँ (⌘ / Ctrl + F or K), scratchpad पर जाएँ (⌘ / Ctrl + Shift + S)
  • files के लिए statistics देखें और unique document profile प्राप्त करें
  • sub features: PDF और images से text extraction, scratchpad का उपयोग, file system changes का automatic sync
  • हल्का installation package और कम memory usage
  • supported file formats
    • documents: csv, docx, key, md, numbers, pages, pdf, pptx, txt, xlsx, xls
    • images: jpg, jpeg, png, gif
    • books: epub, mobi, azw3, pdf
    • audio: mp3, wav, aac, flac, ogg
    • video: mp4, mkv, avi, mov, wmv
  • Rust + NodeJS + Tauri आधारित open source

Semantic search

Search include/exclude

  • file type filter का उपयोग करें या उसे सीधे search query में लिखें (उदाहरण: invoice pdf)
  • exact phrase search के लिए keyword पर quotes का उपयोग करें (उदाहरण: "annual report")
  • search से बाहर रखने वाले keyword के आगे hyphen लगाएँ (उदाहरण: "annual report" -2022 -pdf)

समय के आधार पर search

  • date range filter का उपयोग करें या search query में date/time period सीधे लिखें
  • उदाहरण: **last month** pdf invoice, annual report ppt **this year**

Source से build करना

  • Buzee, Mac पर सबसे बेहतर प्रदर्शन करता है, जबकि Windows और Linux पर इसकी पर्याप्त testing नहीं हुई है
  • Rust और NodeJS install करने के बाद, npm install और cargo install commands का उपयोग करके development mode में app चलाया जा सकता है

TODO / ज्ञात समस्याएँ

  • search results में matching text दिखाना, browser history search में complex query support जैसी कई features में सुधार की ज़रूरत है
  • documents में 'tags' जोड़ना, 'dashboard' view बनाना, codebase में tests जोड़ना जैसी नई features विकसित करने की ज़रूरत है

Tech stack

  • backend: Rust, Tauri v2, SQLite, Tantivy
  • frontend: Svelte 4, TypeScript, TailwindCSS

Architecture

  • सभी file metadata, SQLite की document table में store किए जाते हैं
  • metadata table में full-text index बनाया जाता है और Tantivy में store किया जाता है
  • Firefox, Chrome, Arc की history को उनकी-अपनी history databases के माध्यम से search किया जाता है

License

  • MIT license.

3 टिप्पणियां

 
dhlee0305 2024-12-16

यह 0.1.1 version है, इसलिए थोड़ा हिचकिचाहट हुई, लेकिन... फिलहाल बिना किसी समस्या के काम करता है.
हालांकि, मैं PC इस्तेमाल कर रहा हूँ, इसलिए शायद इसे कम resource उपयोग करने के लिए सेट किया गया है, लेकिन indexing की speed थोड़ी धीमी लगती है.
साथ ही, यह images सहित files के अंदर का text भी खोज देता है, इसलिए सुविधाजनक है. इसमें थोड़ा Google Desktop जैसा एहसास आता है.

 
GN⁺ 2024-12-16
Hacker News राय
  • एक उपयोगकर्ता ने अनुरोध किया कि विफलता के कारणों और अगर अभी शुरू करना हो तो क्या अलग करेंगे, इस यात्रा को साझा किया जाए। उसने यह भी सवाल उठाया कि कई universal search startup बाज़ार की कमी या अनुकूलन की समस्याओं के कारण क्यों विफल हो जाते हैं

  • open source करने के लिए धन्यवाद देते हुए एक राय में यह बताया गया कि इसमें AI search फीचर नहीं है। उनका मानना था कि ऐप की बुनियाद मज़बूत है, लेकिन व्यावहारिक उपयोग के लिए इसे और निखारने की ज़रूरत है

  • एक टिप्पणी में बताया गया कि Recoll नाम के प्रोग्राम का उपयोग करके विभिन्न फ़ाइलें खोजी जा सकती हैं। Thunderbird फ़ोल्डर में सहेजे गए MS-Word दस्तावेज़ खोजने और PDF फ़ाइलों को डबल-क्लिक से खोलने की क्षमता पर ज़ोर दिया गया

  • किसी ने डाउनलोड न होने की समस्या का ज़िक्र किया और कहा कि यह ऐसे माहौल में उपयोगी हो सकता है जहाँ इलेक्ट्रॉनिक रिकॉर्ड इतने विशाल हों कि Windows search काम न करे। इलेक्ट्रॉनिक फ़ाइल प्रबंधन की आवश्यकता पर ज़ोर दिया गया

  • Labrador Retriever नाम के प्रोग्राम का उपयोग न करने वाला एक मज़ाक किया गया और साथ में अपने कुत्ते की तस्वीर साझा की गई

  • एक टिप्पणी में कहा गया कि यह Microsoft SharePoint जैसे फ़ीचर लागू करने की कोशिश थी, और MS-केंद्रित कंपनियों को मनाना business के लिहाज़ से समस्या था। साथ ही यह सवाल पूछा गया कि क्या SharePoint के ऊपर उत्पाद बनाया जा सकता है

  • डाउनलोड लिंक के काम न करने की समस्या बताई गई और सुझाव दिया गया कि जिन प्रोजेक्ट्स में GUI मुख्य मूल्य हो, उनमें screenshot शामिल होने चाहिए

  • जटिल फ़ाइल खोज के लिए यह विकल्प सुझाया गया कि duckdb के extension का उपयोग कर file system पर SQL चलाया जाए

  • Google Drive, GitHub, GitLab, Box.com और local files को खोज सकने वाले किसी ऐप के लिए सिफारिश माँगी गई

  • open source करने के लिए धन्यवाद देते हुए यह भी बताया गया कि documentation की कमी है। एक व्यक्ति ने कहा कि वह AI documentation system बना रहा है, और पूछा कि क्या वह दस्तावेज़ लिखकर PR बना सकता है। उसने AkiraDocs प्रोजेक्ट का परिचय भी दिया