- NotebookLM के डिज़ाइन प्रभारी ने मुख्य user experience और brand system को experimental stage से launch तक कैसे डिज़ाइन किया, इसका पूरा सारांश दिया है
- NotebookLM का लक्ष्य tab overwhelm को कम करने के लिए पढ़ना, बातचीत और creation को एक ही जगह जोड़ने वाली 3-panel structure और responsive panel system स्थापित करना था
- information flow को Inputs → Chat → Outputs जैसे स्पष्ट mental model में व्यवस्थित कर, user अपनी स्थिति न खोए—ऐसा context-oriented UX लागू किया गया
- Audio Overviews जैसी सुविधाओं ने source citations और interrupt patterns सहित AI-native interaction को वास्तविक workflow में एकीकृत किया
- नतीजतन, एक छोटी और agile team ने brand identity से visual assets तक लगातार फैल सकने वाला AI-first product design framework बनाया—यही इसका प्रमुख संकेत है
Architecture
- यह साझा किया गया है कि project ने पढ़ना, बातचीत और creation के संयोजन को लक्ष्य बनाकर UI architecture को experiment से launch-level system तक कैसे विकसित किया
- UI Evolution image दिखाती है कि शुरुआती experimental interface कैसे 3-panel structure की ओर converge हुआ
- पूरे design में scalability और adaptability को प्राथमिकता देते हुए ऐसा grid/panel principle अपनाया गया, जिससे नए tools और modes जुड़ने पर भी structure न टूटे
Early Prototype & Notes-driven UI
- शुरुआत में notes-centered canvas पर exploratory chat overlay रखने की कोशिश का परिचय दिया गया है
- notes और conversation को एक ही screen पर साथ रखते हुए cognitive load कम करने वाला layout खोजने के लिए कई बार iteration किए गए
- नतीजतन, chat को सिर्फ tool नहीं बल्कि view के एक axis के रूप में ऊपर उठाया गया, जो बाद में panel system का core axis बना
3-Panel Structure
- अंतिम structure Source / Chat / Studio(Notes) की 3-way panel layout है, जिसमें कम चौड़ाई पर भी मुख्य icons बने रहें—ऐसी responsive panel व्यवस्था अपनाई गई
- layout presets जैसे Standard और Reading + Chat अलग-अलग स्थिति के लिए optimized configuration देते हैं, जो citation और reference-centric work को support करते हैं
- user के focus के अनुसार panel width dynamically readjust होती है, जिससे tools के बीच switching friction कम होती है
Problem + Requirements
- मुख्य समस्या कई tools के बीच भटकती fragmented experience से पैदा होने वाला tab overwhelm था, और आवश्यकता यह थी कि इसे एक ही जगह input, conversation और output के रूप में जोड़ा जाए
- input side पर Source list / Open Source(wide), output side पर Notes list / Open Note(wide), और बीच में Chat और Citations रखे गए
- creation actions के लिए multiple entry points दिए गए, ताकि user flow तोड़े बिना सीधे output authoring तक जा सके
Early Sketches
- आज का structure भले self-evident लगे, लेकिन यह अनगिनत iterations के बाद पहुँचा गया परिणाम था
- उड़ान के दौरान कागज़ खत्म होने पर napkin sketch से अंतिम हल मिला—यह exploration record भी साझा किया गया
- लक्ष्य ऐसा block-combination approach बनाना था जो स्पष्ट mental model और digestible UI दोनों को साथ पूरा करे
Mental Model
- mental model का केंद्र Inputs → Chat → Outputs जैसा linear लेकिन flexible flow है
- user documents, notes और references लाता है, फिर questions, organization और synthesis के जरिए notes, study guides, Audio Overviews जैसे structured outputs बनाता है
- यह model नई AI interactions की complexity को sense of place और step-by-step feel के माध्यम से संभालने योग्य बनाता है
Solution • 3 Panel Structure details
- responsive panel system user की ज़रूरत के अनुसार fluidly scale करता है और minimum width पर भी source और note accessibility बनाए रखता है
- Standard layout source, chat और notes का balanced default view देता है
- Reading + Chat ऐसा configuration है जो citation-based response generation के लिए optimized है और evidence presentation flow को मजबूत करता है
Panel States
- panel states ज़रूरी element icons को बनाए रखते हुए और width levels के अनुसार restructuring करके space efficiency को अधिकतम करते हैं
- panel के भीतर content बदल जाए, तब भी structural principles fixed रहते हैं, जिससे आगे नए tools और workflows जोड़ने में flexibility मिलती है
- design principles को growth potential और resilience के रूप में संक्षेपित किया गया है
Source Panel
- यह user द्वारा दिए गए सभी sources (inputs) का base है और काम की journey का starting point बनता है
- source का organization, viewing और switching तेज़ी से होता है और यह central Chat के साथ interaction को बढ़ाता है
- minimum width पर भी visual cues को बनाए रखकर context loss रोका जाता है
Studio Panel
- यह वह जगह है जहाँ input output में बदलता है और creation, refinement और recording का काम होता है
- notes, reports, study guides जैसे अलग-अलग output types को समेटने वाली container-style view डिज़ाइन की गई है
- हाल की release में flashcards, quizzes, professional reports के रूप में expansion examples दिखाए गए
Chat Panel
- यह experience का core axis है, जो हमेशा मौजूद रहता है और ज़रूरत के अनुसार auto-resize होता है
- source citation और evidence presentation पर आधारित conversation design के ज़रिए विश्वसनीय AI interaction दिया जाता है
- जब दूसरे tools foreground में हों तब भी conversation context सुरक्षित रखा जाता है, ताकि flow टूटे नहीं
User Journey • Annotated Overview
- annotated user journey input collection → conversation के जरिए understanding/organization → output generation के चरणबद्ध interaction को visualize करती है
- हर चरण में panels के बीच focus shift और state transitions कैसे organic तरीके से जुड़ते हैं, यह समझाया गया है
- लक्ष्य context retention और work speed दोनों हासिल करने वाला end-to-end experience बनाना है
Audio Overviews
- Audio Overviews ने idea से prototype और launch तक की प्रक्रिया में interrupt patterns जैसे नए interaction paradigms पेश किए
- इस feature की उपयोगिता source-grounded, one-click summary/learning में है, और नाम के बारे में यह भी साझा किया गया कि इसे संयोग से लेखक ने नाम दिया
- यह छोटे cross-functional team collaboration के जरिए तेज़ experiment-to-launch cycle हासिल करने का उदाहरण है
Brand Identity
- Google Labs और central brand team के साथ करीबी सहयोग से brand identity और visual system को तेज़ी से परिभाषित किया गया
- color, type, icon, illustration जैसे multi-asset तत्वों को एकसमान और scalable design language में स्थापित किया गया
- यह ज़ोर दिया गया कि product experience और brand tone दोनों एक ही संदेश दें, इसलिए UX और BI alignment अहम है
Visual Assets
- press kit से लेकर launch visuals तक full-stack asset creation के उदाहरण दिखाए गए
- web hero image, animation, key visual जैसे high-fidelity assets के जरिए message clarity और reach को बढ़ाने में मदद मिली
- Keyword blog जैसे external channels के साथ message consistency बनाए रखकर expanded communication को support किया गया
Key Takeaways from the Journey
- Audio Overviews के build experience से मिली सीख में users के साथ मिलकर product बनाना, जल्दी public launch और iteration, और inline citations की demand का जवाब देना शामिल है
- AI को built-in तरीके से समस्या हल करने वाला AI-native product होना चाहिए, और research तथा real-world use tasks के बीच की दूरी पाटने वाला design सबसे अहम है
- dynamic, context-aware UI महत्वपूर्ण है, और transition phase में Chat एक परिचित anchor और नए अनुभव तक पुल की तरह काम करता है
1 टिप्पणियां
Hacker News राय
यह पोस्ट NotebookLM की तरह लगती है—मूल रूप से सरल, लेकिन डिज़ाइन में ज़रूरत से ज़्यादा जटिल। ज़रूरत सीधी है: कोई फ़ाइल चुनकर उससे बातचीत करनी है या उसका सार चाहिए। लेकिन वास्तव में जानकारी का घनत्व कम है, और कार्ड, बटन, सेक्शन, आइकन इतने ज़्यादा हैं कि मुख्य UX तक पहुँचना मुश्किल हो जाता है। मैं डिज़ाइनर की सोच सुनना चाहता था, लेकिन उल्टा scrolljacking, image carousel, और अनावश्यक visual hierarchy जैसे तत्व उपयोग अनुभव में मदद करने के बजाय बाधा बनते हैं। अच्छी बातें हैं, यह मानता हूँ, लेकिन UI की वजह से मूल बात पर ध्यान देना कठिन हो जाता है.
यह नकारात्मक टिप्पणी नहीं, बल्कि काफ़ी relatable नज़रिया है। अगर आपको फ़ाइलों से बातचीत करनी है, तो Gemini, ChatGPT, Claude भी अच्छा काम करते हैं। इस experimental product का लक्ष्य यह रचनात्मक रूप से सोचना था कि क्या यह सचमुच sources पर आधारित tool बन सकता है। यूज़र की ज़रूरतों के अनुसार हमने तेज़ी से कई प्रयोग किए, और आगे भी ऐसे feedback के आधार पर यह evolve करता रहेगा। मेरी वेबसाइट के मामले में, visual elements का उपयोग निर्णय-प्रक्रिया को थोड़ा बेहतर ढंग से दिखाने के लिए किया गया है.
लगता है इस phenomenon के लिए कोई उपयुक्त German शब्द होना चाहिए। कभी-कभी लोग कमियों को ऐसे पेश करते हैं जैसे वही सफलता में योगदान देने वाली बात रही हों। Big Tech presentations में यह अक्सर दिखता है—असल में चीज़ किसी समस्या के बावजूद सफल हुई होती है, लेकिन उसे प्रेरक कहानी की तरह सुनाना दिलचस्प लगता है.
इसमें एक irony है कि 80 के दशक से मौजूद 3-panel layout को समझाने के लिए अंतहीन स्क्रॉल करना पड़ता है.
यह साफ़-सुथरा दिखता है, लेकिन वास्तव में NotebookLM का user experience अच्छा नहीं है। सेवा इतनी अच्छी है कि मैं इसे इस्तेमाल करता रहता हूँ, लेकिन UI इसमें मेरी सबसे नापसंद चीज़ है.
शुरू में लगा था कि यह कितना असुविधाजनक होगा, लेकिन वास्तव में इसे इतना overdesigned देखकर मज़ेदार लगा.
यह साइट मेरा portfolio है, और अलग-अलग लोगों की राय देखना दिलचस्प है। डिज़ाइन अपने स्वभाव से iteration और evolution पर चलता है। NotebookLM आगे भी बदलता रहेगा। मुझे लगता है कि जब यह product शुरुआती चरण में था तभी उससे जुड़ पाना मेरे लिए बहुत सौभाग्य की बात थी। एक डिज़ाइनर के रूप में मैं तकनीक के भविष्य का अनुमान लगाकर उसके अनुरूप UI बनाना चाहता था। मुझे लगता है Google labs टीम सचमुच बहुत तेज़ और future-oriented तरीके से काम कर रही थी। डेढ़ साल तक हमने यूज़र feedback सुना, iterate किया, और product को बढ़ाया। ज़िंदगी में किसी नए product को 0 से 1 तक ले जाना अद्भुत अनुभव था। मैंने कभी नहीं सोचा था कि मेरा portfolio इस तरह इतना प्रसिद्ध हो जाएगा.
क्या Google IP को लेकर सार्वजनिक रूप से क्या उपयोग किया जा सकता है, इस पर कोई सीमाएँ या नियम हैं?
मुझे साइट में एक bug मिला। यह browser या extension को ऐसा signal भेज रही है जैसे dark mode लागू हो, और इसी वजह से जबकि असल में dark mode नहीं है, चीज़ें ठीक से काम नहीं करतीं.
आपकी मेहनत के लिए धन्यवाद। मैं कभी-कभी शिकायत करता हूँ, लेकिन अब तक जो मैंने इस्तेमाल किया है, उनमें यह सबसे engaging learning product है। उम्मीद है यह आगे भी बेहतर होता रहेगा.
“तकनीक के भविष्य की दिशा में स्केट करना” वाली बात बहुत गहराई से resonate करती है। आख़िरकार यह कोई ऐसी science नहीं है जो पूरी तरह योजना के अनुसार चलती हो, बल्कि यह art है। यह ऐसा क्षेत्र है जिसमें लगातार tuning की ज़रूरत होती है। मुझे लगता है कि अलग-अलग roles और यूज़र feedback के आधार पर यह project evolve हुआ होगा। NotebookLM ने बाज़ार को हिला दिया है, और मुझे विश्वास है कि यह आगे Bard या Gemini के शुरुआती दिनों की तरह और बेहतर होगा—खासतौर पर UI/UX के मामले में.
मैं NotebookLM को हर दिन इस्तेमाल करता हूँ। डिज़ाइन की सादगी के लिए आभारी हूँ, लेकिन जैसे-जैसे features जुड़ते हैं, UI को बनाए रखते हुए उसे scale करना मुश्किल हो जाता है। हाल ही में flashcards और quiz जुड़ने के बाद 'Artifacts Button Container' 6 बड़े बटनों के साथ 328px ऊँचा हो गया। भारत में छोटे स्क्रीन वाले users अपने notes देख ही नहीं पा रहे थे, इसलिए उन्होंने Discord फ़ोरम पर मदद माँगी। तब मैंने उसे collapsible बनाने के लिए Tampermonkey script बनाई [collapse script]। सुना है टीम इसे जल्द ठीक करेगी, लेकिन release से पहले और validation की ज़रूरत थी। ऐसे मुद्दों को मैंने खुद script से ठीक किया। सबसे अजीब बात 'notes' है, जहाँ 2000 अक्षरों के essay को 360px sidebar में पढ़ने के लिए मजबूर किया जाता है। इसलिए मैंने fullscreen में देखने के लिए भी एक script बनाई [fullscreen script]। chat input box में भी समस्या है—follow-up questions ठीक से काम नहीं करते और selection के बाद भी अस्थिर रहते हैं। मैं इस पर पूरे दिन बात कर सकता हूँ, लेकिन मुझे लगता है कि इसे ठीक करना ज़्यादा बेहतर है.
मुझे NotebookLM का UX पसंद नहीं है। layout उलझा हुआ है और UI जिन concepts को बताना चाहता है, वे intuitive नहीं लगते। backend की power frontend में ठीक से नहीं उतरती। फिर भी लेख साफ़-सुथरा है और लेखक की सोच स्पष्ट रूप से महसूस होती है। मैं निष्कर्ष और परिणाम से सहमत नहीं हूँ, लेकिन उम्मीद है कि और सावधानी से किए गए प्रयास सामने आते रहेंगे। बाज़ार के तेज़ बदलावों के बीच craftsmanship वाला डिज़ाइन आसान नहीं है.
मुझे लगता है NotebookLM अपनी interface की वजह से नहीं, बल्कि उसके बावजूद सफल हुआ है। सच कहूँ तो UX बहुत ख़राब है। backend engineers को बड़ा श्रेय जाता है। साधारण text copy/paste जैसी चीज़ भी ढूँढने में काफ़ी समय लगा। text editing भी अच्छी नहीं है। समझ नहीं आता कि dedicated Markdown notes area क्यों नहीं है। ज़्यादातर लोग PDF से ज़्यादा text paste करने के आदी हैं, इसलिए folder और file structure भी होना चाहिए। Notes app का UI notes edit और maintain करने के लिए उपयुक्त नहीं है.
मैंने NotebookLM कभी इस्तेमाल नहीं किया, इसलिए जानना चाहता हूँ कि Claude Projects में फ़ाइलें upload करके वहीं chat करने की तुलना में इसमें ऐसा क्या ख़ास है जो इसे बेहतर बनाता है। मुझे पता है कि podcast feature अलग है, लेकिन दोनों सेवाएँ इस्तेमाल करने वालों की तुलना सुनना चाहूँगा.
मुझे podcast feature की वजह से NLM पसंद है। हाल में मैं हर सुबह learning podcast चलाकर दिन की शुरुआत करता हूँ, और यह वास्तव में बहुत अच्छा लगता है.
मेरी भी यही राय है। अब मैं Claude Code और Codex CLI में folder के भीतर सामग्री रखकर वहीं सीधे काम करता हूँ.
इसमें कई अच्छी बातें भी हैं, जैसे 3-panel structure और बाईं ओर source viewer। लेकिन कुछ बातें असुविधाजनक लगीं। पहली, 3-panel को top bar icon से toggle किया जा सकना चाहिए, और अगर chat और notes एक साथ इस्तेमाल नहीं हो रहे हों तो यह जगह की बर्बादी है। दूसरी, बीच का बड़ा area पूरी तरह output पर केंद्रित होना चाहिए। chat audio overview जितनी विशेष सुविधा नहीं है, इसलिए उसे साइड में रखा जा सकता है। तीसरी, information density बहुत कम है और button व icon बड़े और भद्दे हैं। AI को भारी मात्रा की जानकारी संभालनी होती है, इसलिए screen space महत्वपूर्ण है, और यहाँ यह उसके ख़िलाफ़ जाता है। NBLM का आकर्षण audio overview में है। chat-based Q&A, citations को छोड़ दें, तो बड़े LLMs में लगभग बुनियादी सुविधा है। और यह सिर्फ Gemini Flash इस्तेमाल करता है, इसलिए इसमें search-oriented model जैसा feel आता है; बेहतर होगा कि इसे reasoning model के साथ जोड़ा जाए.
मैंने एक किताब की फ़ाइल अपलोड की और NotebookLM से बातचीत करते हुए उपयोगी बातें निकालीं, लेकिन किसी कारण वह बातचीत save नहीं हुई, इसलिए बाद में वापस जाकर उसे ढूँढना या आगे बढ़ाना संभव नहीं था। Gemini या GPT जैसी दूसरी AI सेवाओं के विपरीत, इसका UX/UI उल्टा क्यों है, समझ नहीं आता। और NotebookLM सामग्री के आधार पर essay भी लिखकर नहीं दे पाता.
context size और podcast अच्छे हैं, लेकिन UX समझ नहीं आता। notes की concept स्पष्ट नहीं है। मेरी notes और AI notes में आख़िर अंतर क्या है, समझ नहीं आता। हो सकता है यह मेरे paper workflow (PhD in Psy) से मेल न खाने की वजह से हो, या शायद मैं elicit का आदी हो गया हूँ.
notes तब मददगार होते हैं जब आप notebook किसी और के साथ share करते हैं। snippets के ज़रिए आप तुरंत मुख्य बातचीत के बिंदु दे सकते हैं.
autism researcher होने के नाते मुझे भी 'notes' की concept समझ नहीं आती। क्या इसे OneNote जैसे note app की तरह इस्तेमाल करना है? LLM के साथ papers interact करके पढ़ने से गति ज़रूर बढ़ती है। मैंने गाड़ी चलाते समय audio overview भी इस्तेमाल किया, लेकिन उससे बहुत गहरे scientific content में उतरना मुश्किल लगा.
जो लोग इसे लगातार इस्तेमाल करते हैं, उनसे पूछना चाहता हूँ: आप इसका मुख्य उपयोग किस काम के लिए करते हैं? audio overview के अलावा, सामान्य chat या document integration की तुलना में इसमें बेहतर क्या है?
मैं arxiv papers, Hacker News comments, और अन्य लंबे texts को podcast में बदलकर commute के दौरान सुनता हूँ.
मैं एक technical consultant हूँ जो contract के बाद पहली बार ग्राहक से मिलता है। मैं पिछली meeting transcripts और contract terms को NotebookLM में डालकर goals, risks, या priority जैसे high-level सवाल पूछता हूँ। उसी के आधार पर मैं पहली meeting के लिए slides तैयार करता हूँ, और बाद में discovery session transcripts भी जोड़ता हूँ। यहाँ से मैं management approach evaluation report का draft तक निकाल लेता हूँ। लेकिन LLM द्वारा लिखी चीज़ें मैं सीधे client को नहीं दिखाता; मैं उन्हें अपनी शैली में ज़रूर दोबारा लिखता हूँ। हमारी company आधिकारिक रूप से GSuite इस्तेमाल करती है, और NotebookLM का source curation अच्छा होना इसका फ़ायदा है.
जटिल board game rules में rulebook खंगालने के बजाय सिर्फ सवाल पूछो, और यह citations के साथ जवाब दे देता है—game सीखने में यह बेहद उपयोगी है.
मुझे audio से ज़्यादा video explanation बेहतर लगती है.
मेरा एक दोस्त इसे विश्वविद्यालय की परीक्षा की तैयारी में quiz और flashcards बनाने के लिए इस्तेमाल करता है.