4 पॉइंट द्वारा GN⁺ 2026-01-11 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Claude Code का उपयोग करके 100 किताबों में विषयों के बीच संबंधों को स्वतः खोजने वाला एक वेब-आधारित प्रोजेक्ट
  • हर किताब की अवधारणाओं का विश्लेषण करके ‘Useful Lies’, ‘Invisible Crack’, ‘Name Game’ जैसी 40 से अधिक थीम-आधारित कनेक्शन (trail) को विज़ुअलाइज़ किया गया है
  • हर trail मनोविज्ञान, तकनीक, संगठन, रचनात्मकता, सिस्टम सोच आदि विभिन्न क्षेत्रों की अवधारणाओं को आपस में जोड़ता है
  • उपयोगकर्ता हर trail पर क्लिक करके संबंधित किताबों और मुख्य अवधारणाओं (जैसे: Self-deception, Innovation, Tacit knowledge) को देख सकते हैं
  • AI ज्ञान के बीच संबंधों को संरचनात्मक रूप से खोजने का एक नया पढ़ने और शोध करने का तरीका पेश करता है

प्रोजेक्ट अवलोकन

  • Trails Claude Code का उपयोग करके कई किताबों की सामग्री का विश्लेषण करता है और साझा विषयों या वैचारिक संबंधों को स्वतः निकालने वाला एक सिस्टम है
    • वेबसाइट trails.pieterma.es पर उपलब्ध है
    • प्रोजेक्ट कैसे काम करता है, यह अलग विवरण पेज (explainer) पर देखा जा सकता है
  • परिणाम किताबों के बीच विषयगत संबंधों को ‘trail’ के रूप में विज़ुअलाइज़ करता है
    • हर trail किसी विशेष अवधारणा के इर्द-गिर्द कई किताबों के विचारों को जोड़ता है

प्रमुख trail उदाहरण

  • Useful Lies: आत्म-छल को रणनीति के रूप में इस्तेमाल करने वाले मानवीय व्यवहार पर केंद्रित
    • संबंधित अवधारणाएँ: Self-deception, Evolutionary psychology, Blue lies
  • Invisible Crack: सूक्ष्म दोषों के जमा होने से विनाशकारी विफलता तक पहुँचने की प्रक्रिया
    • संबंधित अवधारणाएँ: Brittle fracture, Metal fatigue, Gradual change
  • Ideas Mate: कमजोर intellectual property rights सहयोगात्मक copying के जरिए innovation को तेज़ करते हैं
    • संबंधित अवधारणाएँ: Innovation spillover, Japanese copying, Open source
  • Desperate Pivots: वे उदाहरण जहाँ मजबूरी ने नवोन्मेषी बदलाव को जन्म दिया
    • संबंधित अवधारणाएँ: Odeo reinvention, Startup pivot, Hindsight bias
  • Expert Intuition: विशेषज्ञता सचेत सोच से आगे बढ़कर सहज ज्ञान के रूप में काम करती है
    • संबंधित अवधारणाएँ: Tacit knowledge, Mētis knowledge, Intuition

ज्ञान कनेक्शन की विविधता

  • trails तकनीक, संगठन, मनोविज्ञान, अर्थशास्त्र, रचनात्मकता जैसे व्यापक क्षेत्रों को समेटते हैं
    • उदाहरण: Proxy Trap (मेट्रिक optimization का जाल), Legibility Tax (standardization की कीमत), Joy Dividend (आनंद की उत्पादकता)
  • हर trail 3~4 मुख्य keywords से बना है, जिससे अवधारणाओं के बीच संबंधों को सहज रूप से खोजा जा सकता है
  • दृश्यात्मक और विषयगत खोज के जरिए पाठक किताबों के विचारों को नए संदर्भ में जोड़ सकते हैं

तकनीकी विशेषताएँ

  • Claude Code हर किताब की सामग्री का विश्लेषण करके semantic similarity के आधार पर कनेक्शन बनाता है
  • परिणाम link-based interface के रूप में दिए जाते हैं, जिससे उपयोगकर्ता विषय के आधार पर खोज कर सकते हैं
  • हर trail पेज में छोटा सार-वाक्य और संबंधित concept tags होते हैं

महत्व

  • AI द्वारा ज्ञान के संरचनात्मक संबंधों की स्वतः खोज करने का एक प्रयोगात्मक प्रयास
  • पाठकों और शोधकर्ताओं के लिए अलग-अलग क्षेत्रों के विचारों को जोड़कर सोच का दायरा बढ़ाने वाला उपकरण
  • किताब-आधारित डेटा और AI विश्लेषण के संयोजन से एक नए तरह का ‘एकीकृत पठन अनुभव’ प्रस्तुत करता है

1 टिप्पणियां

 
GN⁺ 2026-01-11
Hacker News टिप्पणियाँ
  • काम अपने-आप में सुंदर है, लेकिन वास्तविक data output लगभग बेकार लगता है
    ऐसा महसूस होता है कि statistical model को बहुत ज़्यादा critical thinking सौंप दी गई है
    मैंने भी कई advanced LLMs को लंबे समय तक टेस्ट किया है, लेकिन texts के बीच ‘अदृश्य संबंध’ ढूँढना अभी भी संभव नहीं लगा। इंसानी intuition अभी भी ज़रूरी है

    • “Us/Them”, “fictions” जैसे सिर्फ एक शब्द से जुड़ने के बजाय, अगर concept level पर कनेक्शन हों तो ज़्यादा उपयोगी होगा
    • इसे थोड़ा और गहराई से देखना चाहिए। collective-brain trail शानदार है
    • मैंने भी बहुत सारे texts को RAG से बनाया और keyword, जगह, तारीख आदि के आधार पर extract किया, लेकिन LLM बिना reranker के ठीक-ठाक नतीजे नहीं दे पाया। vector query चलाने पर जवाब हमेशा आता है, लेकिन ज़्यादातर उसमें irrelevant fragments मिले होते हैं
  • यह सचमुच बहुत बढ़िया काम है। विज़ुअली भी हैरान कर देने वाली परिपक्वता दिखती है

  • शानदार कोशिश है, लेकिन दूसरों की तरह मुझे भी texts के बीच ठोस connection साफ़ नहीं दिखते
    उदाहरण के लिए Jobs और 『The Elephant in the Brain』 के बीच का संबंध LLM पकड़ नहीं पाया, जबकि इंसान इसे आसानी से समझ सकता है — इस मायने में कि self-deception रणनीतिक रूप से काम करती है, दोनों में समानता दिखती है

  • “Thanos committing fraud” वाला वाक्यांश “useful lies” सेक्शन में होना उलझन भरा लगा
    जब संस्थापक जेल में है, तब उस झूठ को ‘उपयोगी’ कहना अजीब है। लगता है AI ने इसे ढीले-ढाले तरीके से classify किया है

    • शायद मतलब यह हो कि “पकड़े जाने तक वह उपयोगी झूठ था”
    • वैसे मेरा ख़याल है कि यहाँ Thanos नहीं, Theranos कहा गया है
  • मैंने भी Claude Code का इस्तेमाल करके उन GitHub projects को ‘पढ़ने’ का प्रयोग किया जिनके बारे में मुझे ज़्यादा पता नहीं था
    रूसी भाषा के trending projects को देखते-देखते मुझे GoodbyeDPI मिला, और मैं deep packet inspection की दुनिया में उतर गया

    • ValdikSS Android के लिए SBC XQ patch की वजह से काफ़ी जाने जाते हैं। संबंधित लेख के लिए Habr article और Android review link देखें
    • GitHub पर ऐसे projects जिनका domain knowledge के बिना समझना मुश्किल है वास्तव में बहुत हैं
  • दो texts को जोड़ने वाली रेखाएँ समझ में नहीं आतीं। ज़्यादातर meaningless links जैसी लगती हैं
    “Father wound” सेक्शन में “abandoned at birth” और “did not” जुड़े हुए हैं, जो सिर्फ visual decoration जैसा लगता है

    • मुझे भी यही लगा
    • देखने में अच्छा है, लेकिन आखिरकार यह LLM द्वारा मनमाने ढंग से बनाए गए links ही हैं
  • मैंने भी ऐसा ही एक प्रोजेक्ट किया था
    pdfplumber से PDF text निकालकर PostgreSQL में डाला, फिर 100 अक्षरों के हिसाब से chunking की और sentence_transformers से 384-dimensional embeddings बनाए
    उसके बाद UMAP + HDBScan से dimensionality reduction और clustering की, और Plotly से visualize किया, जहाँ topic-wise clusters काफ़ी साफ़ दिखे
    Docker Compose से environment सेट किया और Flask-based web UI में ले गया। code को साफ़-सुथरा करने के बाद open source release करने की योजना है

    • मैं आपका approach और repository ज़रूर देखना चाहूँगा
    • यह Bertopic जैसा approach लगता है। शानदार library है
  • मैंने पहले “digital humanities” पर एक किताब पढ़ी थी, जिसमें “distant reading” का विचार बहुत दिलचस्प लगा
    इसमें सैकड़ों या हज़ारों texts को कंप्यूटर से analyze करके macro-level insight हासिल की जाती है
    मेरे एक दोस्त ने अपने paper में Python से ऐसा analysis खुद implement किया था, जो सचमुच दिलचस्प था
    अब LLM की वजह से यह approach और आसान हो गया है, और code न जानने पर भी इसे आज़माया जा सकता है
    संबंधित विचार Distant reading wiki में देखा जा सकता है

    • LLM ऐसे vague descriptions से भी सामग्री ढूँढ देने में काफ़ी उपयोगी है ;)
  • आइडिया अच्छा है, लेकिन हर किताब के theme और narrative के बीच connection कमज़ोर है
    कुछ मामलों में लगता है जैसे सिर्फ एक paragraph देखकर पूरे theme का अनुमान लगाया गया हो
    अगर prompt को कई बार दोहराया जाए या multi-stage extraction process जोड़ी जाए, तो शायद यह और परिष्कृत हो सकता है

  • Deleuze के उद्धरण की तरह, किताब को ‘चलने वाली मशीन’ की तरह भी देखा जा सकता है और ‘अर्थ के डिब्बे’ की तरह भी

    • स्रोत तो नहीं पता, लेकिन यह नज़रिया मुझे बहुत oversimplified लगता है
      Deleuze खुद भी प्रभाव ग्रहण करने वाले विचारक थे, और मुझे लगता है कि इस प्रोजेक्ट की कोशिश अपने-आप में अर्थपूर्ण है
      बस, नतीजे उन लोगों को सटीक नहीं लग सकते हैं जिन्होंने वास्तव में मूल texts पढ़े हैं