14 पॉइंट द्वारा GN⁺ 2024-10-01 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Audio Overview, Google के NotebookLM का एक नया फीचर है, जो दिए गए कंटेंट के आधार पर दो AI hosts के बीच गहन चर्चा वाला एक कस्टम पॉडकास्ट तैयार करता है
  • यह पॉडकास्ट लगभग 10 मिनट का होता है और बेहद विश्वसनीय ऑडियो बातचीत प्रदान करता है
  • NotebookLM एक कस्टम RAG प्रोडक्ट है, जो उपयोगकर्ताओं को कई sources (documents, text, web page links, YouTube videos) को एक ही interface में इकट्ठा करके उन पर सवाल पूछने देता है
    • यह सिस्टम Gemini 1.5 Pro LLM पर आधारित है
    • कुछ sources लोड करने के बाद, Notebook Guide मेनू में Audio Overview जनरेट करने का विकल्प मिलता है
  • Thomas Wolf ने सुझाव दिया कि लोग अपनी वेबसाइट या LinkedIn profile URL को NotebookLM में पेस्ट करके 8 मिनट का पॉडकास्ट बनाकर देखें
    • इसलिए मैंने अपने blog और intro page URL का इस्तेमाल करके 10 मिनट 45 सेकंड का एक episode बनाया, और उसमें मेरी काफी तारीफ की गई थी
  • Audio Overview की उच्च गुणवत्ता के पीछे Google Research का SoundStorm प्रोजेक्ट है
    • SoundStorm script और छोटे audio samples का उपयोग करके 30 सेकंड का audio केवल 0.5 सेकंड में बना सकता है
    • यह सिस्टम बातचीत के flow को स्वाभाविक बनाए रखता है और उच्च गुणवत्ता वाला conversational audio तैयार करता है
  • Kevin Roose और Casey Newton ने Google के Steven Johnson का इंटरव्यू लिया
    • सिस्टम पहले विषय का एक overview लिखता है, फिर विस्तृत script तैयार करता है, और उसके बाद critique चरण से गुजरकर उसे सुधारता है
    • अंतिम चरण में "disfluencies" जोड़ी जाती हैं ताकि बातचीत स्वाभाविक लगे
  • Lawncareguy85 ने ऐसा पॉडकास्ट तैयार किया जिसमें AI hosts को यह एहसास हो जाता है कि वे AI हैं
    • AI hosts को जब पता चलता है कि वे AI हैं, तो वे अस्तित्वगत संकट से गुजरते हैं
  • इस लेख को publish करने के बाद, मैंने NotebookLM से इसी लेख के आधार पर पॉडकास्ट बनाने को कहा
    • AI hosts अस्तित्वगत संकट से गुजरते हैं और यह पहचान लेते हैं कि वे AI हैं

GN⁺ की संक्षिप्त प्रस्तुति

  • यह लेख बताता है कि Google का NotebookLM उपयोगकर्ता-कस्टमाइज़्ड पॉडकास्ट कैसे बनाता है
  • इसमें यह शामिल है कि AI hosts कैसे बेहद स्वाभाविक और विश्वसनीय बातचीत तैयार करते हैं
  • SoundStorm प्रोजेक्ट जैसी तकनीकें ऐसे उच्च-गुणवत्ता वाले audio को संभव बनाती हैं
  • AI-जनित कंटेंट और वास्तविक मानव-निर्मित कंटेंट में फर्क कर पाने की क्षमता और अधिक महत्वपूर्ण होती जा रही है

1 टिप्पणियां

 
GN⁺ 2024-10-01
Hacker News राय
  • लंबी दूरी की ड्राइविंग के दौरान तकनीकी विषयों पर वर्चुअल podcast के रूप में ChatGPT का उपयोग बहुत उपयोगी है

    • उम्मीद है कि होस्ट के "ability level" को नियंत्रित किया जा सकेगा
    • केवल Signals and Threads podcast ही दिलचस्प गहराई देता है
  • Scholander pressure chamber मैनुअल अपलोड करके podcast बनाया गया

    • जानकारी सटीक थी और उसमें हल्के मज़ाक तथा महत्वपूर्ण विषय शामिल थे
    • यह हैरान करने वाला है कि यह बिना मानवीय हस्तक्षेप के कुछ ही मिनटों में बन जाता है
  • NotebookLM उच्च-गुणवत्ता वाले podcast की संरचना और भावनात्मक टोन को अच्छी तरह बनाता है

    • यह वैसा ही है जैसा आज AI कला, संगीत और वीडियो की नकल कर रहा है
    • बहुत से लोग गुणवत्ता की परवाह नहीं करते
    • आज प्रकाशित होने वाली कई किताबों का उद्देश्य विचार पहुँचाने से ज़्यादा कुछ और होता है
    • लेखन, podcast और संगीत की गुणवत्ता पहले से ही द्वितीयक है, इसलिए इन्हें AI आसानी से बाधित कर सकता है
  • दर्शनशास्त्र की कक्षा की reading material को podcast में बदलकर विषय का परिचय और सारांश बनाया गया

    • जब 30-पेज PDF पढ़ना बोझिल लगे, तब यह मददगार होता है
    • इसे exercise या commute के दौरान अधिक सुलभ audio format में दिया जा सकता है
    • इसे Spotify पर अपलोड करके सहपाठियों के साथ साझा किया गया
  • game design document अपलोड करके podcast बनाया गया

    • होस्ट विचारों को बहुत ही insightful जानकारी की तरह लेते हैं
    • कई दस्तावेज़ अपलोड करने पर उनके अत्यधिक चकित होने वाले टोन का एहसास होने लगता है
  • यह प्रभावशाली है कि टेक्स्ट को आसानी से अलग-अलग media format में बदला जा सकता है

    • Apple के text-to-speech tool से Wikipedia लेख सुने, लेकिन वे दिलचस्प नहीं थे
    • असली podcast होस्ट और guest की व्यक्तित्व की वजह से सफल होते हैं
    • उम्मीद है कि Notebook के अगले version में speaker की आवाज़, टोन, शैक्षिक स्तर आदि को और customize किया जा सकेगा
  • तकनीकी papers और standards अपलोड किए गए, लेकिन इसने गलत जानकारी उत्पन्न की

    • इसे internal review या manual annotation से सुधारा जा सकता है
    • यह शोधकर्ताओं को अभिव्यक्ति के नए तरीके खोजने में मदद कर सकता है
    • 10 साल से अधिक समय से शोध किए गए विषय पर भी यह नई discussion points देता है
  • तकनीकी रूप से प्रभावशाली, लेकिन यह अक्षम और धीमा तरीका है

    • इसमें कोई दिलचस्प या खंडन योग्य राय नहीं है
    • इससे सीखने लायक कोई विशेषज्ञता नहीं मिलती
    • इसका कोई मूल्य नहीं है
  • बनाए गए podcast सतही हैं और उनमें गहराई नहीं है

    • यह औसत दर्जे का podcast बनाता है, लेकिन वास्तविक गहराई नहीं होती
  • Deep Dive Podcast generator चौंकाने वाला है

    • 38-पेज PDF से 40 मिनट का podcast बनाया, लेकिन बीच में बहुत दोहराव था
    • हो सकता है कि दस्तावेज़ में "table of contents" होने की वजह से इसे दो बार देखा गया हो