• 12 अलग-अलग ईमेल में बिखरे हुए संख्यात्मक मानों को जोड़ने की ज़रूरत पड़ी
  • कॉपी करना झंझट लगा, इसलिए Gmail अकाउंट देखते समय स्क्रीन कैप्चर रिकॉर्ड किया और फिर Google Gemini का इस्तेमाल करके उस वीडियो से संख्याएँ निकालकर देखीं—और यह हैरान करने वाली हद तक अच्छी तरह काम कर गया

AI Studio और QuickTime के साथ किफायती वीडियो स्क्रैपिंग

  • पहले QuickTime Player से संबंधित ईमेल ब्राउज़ करते हुए स्क्रीन रिकॉर्डिंग की गई
  • रिकॉर्ड किए गए 35 सेकंड के वीडियो को Google के AI Studio में अपलोड किया गया और Gemini मॉडल से JSON array फ़ॉर्मेट में extraction करने को कहा गया
    • तारीख और डॉलर राशि शामिल JSON array का परिणाम सफलतापूर्वक वापस मिला
  • परिणाम को Numbers में पेस्ट करने के लिए CSV फ़ॉर्मेट में बदलने को कहा गया और वह भी मिल गया
  • लागत लगभग 0.1 सेंट से भी कम रही, यानी बेहद सस्ती। फिलहाल AI Studio मुफ़्त उपलब्ध है

विकल्पों की सीमाएँ

  • हाथ से डेटा कॉपी करना उबाऊ है और इसमें गलती की संभावना अधिक रहती है
  • Gmail API का उपयोग जटिल है और इसमें काफी मेहनत लगती है
  • ब्राउज़र automation में ईमेल parsing का अलग चरण चाहिए
  • ईमेल अकाउंट एक्सेस वाले उन्नत AI टूल्स का उपयोग prompt injection जैसे जोखिम पैदा कर सकता है

वीडियो स्क्रैपिंग के फायदे

  • स्क्रीन पर दिख रही हर चीज़ निकाली जा सकती है
  • उपयोगकर्ता पूरी तरह नियंत्रित कर सकता है कि AI मॉडल को क्या दिखाया जाए
  • वेबसाइट authentication या anti-scraping तकनीकों का इस पर असर नहीं पड़ता
  • सेटअप की लागत शून्य है
  • बहुत कम लागत में इसका उपयोग किया जा सकता है
  • data journalism के क्षेत्र में भी यह उपयोगी हो सकता है

बोनस: LLM प्राइस कैलकुलेटर

  • लेखक ने token pricing की गणना के लिए अलग से एक टूल बनाया
    • ChatGPT Code Interpreter का उपयोग किया, लेकिन गणना में त्रुटि हुई
  • Claude 3.5 की मदद से प्राइस कैलकुलेटर बनाया
    • input/output token pricing को मैन्युअली सेट किया जा सकता है या preset बटन से मॉडल-वार कीमतें चुनी जा सकती हैं
  • पूरी निर्माण प्रक्रिया Claude के साथ बातचीत के ज़रिए 19 मिनट में 10 versions तक दोहराकर बेहतर की गई
  • कीमत की जानकारी screenshot को सीधे बातचीत में डालकर Claude से extract कराई गई

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.