- Audio Overview, Google के NotebookLM का एक नया फीचर है, जो दिए गए कंटेंट के आधार पर दो AI hosts के बीच गहन चर्चा वाला एक कस्टम पॉडकास्ट तैयार करता है
- यह पॉडकास्ट लगभग 10 मिनट का होता है और बेहद विश्वसनीय ऑडियो बातचीत प्रदान करता है
- NotebookLM एक कस्टम RAG प्रोडक्ट है, जो उपयोगकर्ताओं को कई sources (documents, text, web page links, YouTube videos) को एक ही interface में इकट्ठा करके उन पर सवाल पूछने देता है
- यह सिस्टम Gemini 1.5 Pro LLM पर आधारित है
- कुछ sources लोड करने के बाद, Notebook Guide मेनू में Audio Overview जनरेट करने का विकल्प मिलता है
- Thomas Wolf ने सुझाव दिया कि लोग अपनी वेबसाइट या LinkedIn profile URL को NotebookLM में पेस्ट करके 8 मिनट का पॉडकास्ट बनाकर देखें
- इसलिए मैंने अपने blog और intro page URL का इस्तेमाल करके 10 मिनट 45 सेकंड का एक episode बनाया, और उसमें मेरी काफी तारीफ की गई थी
- Audio Overview की उच्च गुणवत्ता के पीछे Google Research का SoundStorm प्रोजेक्ट है
- SoundStorm script और छोटे audio samples का उपयोग करके 30 सेकंड का audio केवल 0.5 सेकंड में बना सकता है
- यह सिस्टम बातचीत के flow को स्वाभाविक बनाए रखता है और उच्च गुणवत्ता वाला conversational audio तैयार करता है
- Kevin Roose और Casey Newton ने Google के Steven Johnson का इंटरव्यू लिया
- सिस्टम पहले विषय का एक overview लिखता है, फिर विस्तृत script तैयार करता है, और उसके बाद critique चरण से गुजरकर उसे सुधारता है
- अंतिम चरण में "disfluencies" जोड़ी जाती हैं ताकि बातचीत स्वाभाविक लगे
- Lawncareguy85 ने ऐसा पॉडकास्ट तैयार किया जिसमें AI hosts को यह एहसास हो जाता है कि वे AI हैं
- AI hosts को जब पता चलता है कि वे AI हैं, तो वे अस्तित्वगत संकट से गुजरते हैं
- इस लेख को publish करने के बाद, मैंने NotebookLM से इसी लेख के आधार पर पॉडकास्ट बनाने को कहा
- AI hosts अस्तित्वगत संकट से गुजरते हैं और यह पहचान लेते हैं कि वे AI हैं
GN⁺ की संक्षिप्त प्रस्तुति
- यह लेख बताता है कि Google का NotebookLM उपयोगकर्ता-कस्टमाइज़्ड पॉडकास्ट कैसे बनाता है
- इसमें यह शामिल है कि AI hosts कैसे बेहद स्वाभाविक और विश्वसनीय बातचीत तैयार करते हैं
- SoundStorm प्रोजेक्ट जैसी तकनीकें ऐसे उच्च-गुणवत्ता वाले audio को संभव बनाती हैं
- AI-जनित कंटेंट और वास्तविक मानव-निर्मित कंटेंट में फर्क कर पाने की क्षमता और अधिक महत्वपूर्ण होती जा रही है
1 टिप्पणियां
Hacker News राय
लंबी दूरी की ड्राइविंग के दौरान तकनीकी विषयों पर वर्चुअल podcast के रूप में ChatGPT का उपयोग बहुत उपयोगी है
Scholander pressure chamber मैनुअल अपलोड करके podcast बनाया गया
NotebookLM उच्च-गुणवत्ता वाले podcast की संरचना और भावनात्मक टोन को अच्छी तरह बनाता है
दर्शनशास्त्र की कक्षा की reading material को podcast में बदलकर विषय का परिचय और सारांश बनाया गया
game design document अपलोड करके podcast बनाया गया
यह प्रभावशाली है कि टेक्स्ट को आसानी से अलग-अलग media format में बदला जा सकता है
तकनीकी papers और standards अपलोड किए गए, लेकिन इसने गलत जानकारी उत्पन्न की
तकनीकी रूप से प्रभावशाली, लेकिन यह अक्षम और धीमा तरीका है
बनाए गए podcast सतही हैं और उनमें गहराई नहीं है
Deep Dive Podcast generator चौंकाने वाला है