55 पॉइंट द्वारा davespark 2025-11-10 | 3 टिप्पणियां | WhatsApp पर शेयर करें

Google Gemini API में नया लॉन्च किया गया File Search टूल RAG (Retrieval-Augmented Generation) सिस्टम बनाना बेहद सरल बना देता है:

  • पहले की जटिल chunking, embedding और vector DB सेटअप की जगह सिर्फ़ एक बार file upload करने पर (2 lines of code) सब कुछ अपने-आप हो जाता है, और query के समय संबंधित दस्तावेज़ खोजकर model में inject किए जाते हैं.
  • storage और query embedding मुफ़्त हैं, और शुरुआती indexing cost सिर्फ़ $0.15/10 लाख tokens है.
  • supported files: PDF, DOCX, TXT आदि.
  • एक वास्तविक उदाहरण में 3,000 files की खोज सिर्फ़ 2 seconds में पूरी होती है, जिससे prototype development time काफ़ी कम हो जाता है.
  • इसके अलावा automatic citations, metadata filtering जैसी सुविधाएँ भी मिलती हैं.
  • सीमाएँ: हर project में 10 stores की सीमा, free tier में 1GB.
  • मूल्यांकन: RAG development की entry barrier कम होती है और फ़ोकस application पर जा सकता है.

3 टिप्पणियां

 
kaydash 2025-11-11

वाकई, Google ही है

 
dkmin 2025-11-10

शेयर करने के लिए धन्यवाद। क्वालिटी! वाकई जानने की बहुत उत्सुकता है।

 
unknowncyder 2025-11-10

NotebookLM को service के रूप में आते देख कर लगा था कि कभी न कभी शायद NotebookLM API जैसी कोई चीज़ आएगी, और अब इसे File Search नाम की API service के रूप में लॉन्च कर दिया गया है, कमाल।

RAG को ठीक से इस्तेमाल करने के लिए pipeline/workflow बनाना, Ollama चलाना, और अलग-अलग model बदलकर देखना—इन सबमें निश्चित रूप से थोड़ा hurdle था (हालांकि असल में इस्तेमाल करके ही पता चलेगा), लेकिन अगर quality कुछ हद तक भरोसेमंद हुई तो इसे सच में बहुत आसानी से इस्तेमाल किया जा सकेगा।