15 पॉइंट द्वारा GN⁺ 2026-03-04 | 4 टिप्पणियां | WhatsApp पर शेयर करें
  • 18,000 GitHub stars वाले NanoClaw के डेवलपर ने बताया कि जब प्रोजेक्ट का नाम Google में खोजा जाता है, तो आधिकारिक साइट से ऊपर एक नकली वेबसाइट दिखाई देती है
  • किसी ने प्रोजेक्ट के README को scrape करके बनाई गई नकली साइट (nanoclaw[.]net) को Google search results में दूसरा स्थान दिला दिया है, जबकि असली आधिकारिक साइट पाँचवें पेज के बाद भी नहीं दिखती
  • SEO optimization, Google Search Console submission, और प्रमुख IT media coverage से links हासिल करने जैसे सभी वैध कदम उठाने के बावजूद Google search results में कोई बदलाव नहीं आया
  • नकली साइट में malware या phishing links डाले जा सकते हैं, जिससे security-focused project की सबसे बड़ी security vulnerability खुद Google search बन गई है
  • अगर सभी signals साफ़ तौर पर एक ही जवाब की ओर इशारा करने पर भी Google सही result नहीं दिखा पाता, तो इंटरनेट जानकारी के gateway के रूप में Google की reliability पर ही सवाल उठता है

NanoClaw प्रोजेक्ट और नकली साइट समस्या की शुरुआत

  • NanoClaw एक security-first design वाला open source project है, जिसमें सभी agents isolated containers में चलते हैं और सुरक्षित sandbox runtime इसका मुख्य आधार है
  • 2 फ़रवरी को लॉन्च होने के बाद यह तेज़ी से बढ़ा और CNBC, VentureBeat, The Register जैसे बड़े मीडिया में कवर हुआ
  • लॉन्च के शुरुआती दौर में अलग वेबसाइट नहीं थी और GitHub repository ही प्रोजेक्ट का वास्तविक केंद्र थी, क्योंकि ध्यान फीचर डेवलपमेंट और community building पर था
  • 8 फ़रवरी के आसपास किसी ने nanoclaw[.]net domain ले लिया और README से scrape की गई सामग्री से auto-generated site बना दी
  • शुरुआत में उसमें सही GitHub link शामिल था, इसलिए इसे बड़ी समस्या नहीं माना गया

नकली साइट से बढ़ता नुकसान

  • जैसे-जैसे प्रोजेक्ट बढ़ा, अधिक users ने पूछताछ भेजनी शुरू की, जैसे “आपकी वेबसाइट में error है”, “क्या साइट पर ads हैं?”, “मोबाइल पर यह ऐसा क्यों दिखता है?”
  • वह साइट प्रोजेक्ट के बारे में गलत जानकारी दिखा रही है और publication dates तक फर्जी हैं
  • हज़ारों users उस साइट को आधिकारिक साइट समझ रहे थे, और NanoClaw की पहली छवि ads से भरे घटिया पेज जैसी बन रही थी
  • नुकसान हर दिन बढ़ रहा है, और संभव है कि पहले ही लाखों लोग गलत जानकारी के संपर्क में आ चुके हों

आधिकारिक साइट बनाना और SEO से निपटने की कोशिश

  • 2 हफ्ते पहले आधिकारिक वेबसाइट nanoclaw.dev बनाई गई और हर संभव कदम उठाया गया
    • GitHub repository से आधिकारिक साइट का link जोड़ा गया
    • structured data और उचित SEO optimization लागू किया गया
    • Google Search Console में लगभग 15 बार submit किया गया
    • The Register, VentureBeat, The New Stack जैसी media reports से असली साइट के links हासिल किए गए
    • Hacker News पर नंबर 1 रहने वाला blog post प्रकाशित किया गया
    • साइट का 15 भाषाओं में अनुवाद किया गया
    • सभी social profiles से nanoclaw.dev को जोड़ा गया
    • Google, Cloudflare, और domain registrar spaceship.com को takedown notice भेजा गया
  • इंटरनेट पर मौजूद सभी signals nanoclaw.dev को आधिकारिक साइट बता रहे हैं, फिर भी Google search results नहीं बदल रहे

Google search की संरचनात्मक समस्या

  • Google search में पहले स्थान पर दिख रही NanoClaw GitHub repository के website field में nanoclaw.dev स्पष्ट रूप से दर्ज है
  • इसके बावजूद Google अब भी नकली साइट को आधिकारिक साइट से ऊपर दिखा रहा है
  • SEO experts ने “SEO में जीतिए” या “Google Ads खरीदिए” जैसी सलाह दी, लेकिन open source project के डेवलपर को अपने ही प्रोजेक्ट नाम पर SEO युद्ध लड़ना पड़े, यही असली समस्या है
  • यह SEO की नहीं, Google की समस्या है

सुरक्षा जोखिम

  • NanoClaw एक security-focused project है जो agent runtime की safety और sandboxing पर केंद्रित है
  • इस समय प्रोजेक्ट की सबसे बड़ी security vulnerability खुद Google search है
  • नकली साइट चलाने वाला व्यक्ति कभी भी उस पेज पर crypto scams, phishing pages, या malicious download links डाल सकता है
  • वह GitHub repository को fork करके malicious code भी जोड़ सकता है, और फिर Google द्वारा वैध दिखाए जा रहे नकली साइट से उस तक link कर सकता है
  • Google इस स्थिति को real-time में संभव बना रहा एक सक्रिय security risk बन गया है

Google की reliability पर बुनियादी सवाल

  • ऐसे सवाल में भी, जहाँ प्रोजेक्ट खुद सही जवाब साफ़ तौर पर घोषित कर रहा हो, सभी signals एक जैसे हों, और जवाब बिल्कुल भी अस्पष्ट न हो, Google सही result देने में विफल है
  • इससे चुनाव, vaccine, medical, finance जैसी महत्वपूर्ण जानकारी पर क्या Google पर भरोसा किया जा सकता है जैसा बुनियादी सवाल उठता है
  • meta tags या favicon format सही न होने के लिए खुद को दोष देना बंद करना चाहिए; जब Google के पास इतने समृद्ध और स्पष्ट signals होने पर भी वह गलत result दिखाता है, तो इसकी जिम्मेदारी Google की है
  • अगर Google इंटरनेट जानकारी के gateway के रूप में अपनी स्थिति बनाए रखना चाहता है, तो उसे ऐसी बुनियादी समस्याएँ हल करनी होंगी

4 टिप्पणियां

 
xguru 2026-03-04

SEO spammers सच में बहुत मेहनत करते हैं।
अभी खोजकर देखो तो नहीं दिखता, लेकिन अपने बनाए प्रोडक्ट्स को बार-बार सर्च करके चेक करते रहना ज़रूरी है।
मैं भी GeekNews में search keywords से आने वाले ट्रैफिक की रैंकिंग हर बार देखता रहता हूँ। अगर आप वेबसाइट चला रहे हैं, तो Search Console देखना अनिवार्य है।

 
beepp 2026-03-06

nanoclaw खोजने पर अब भी nanoclaw.net, git के नीचे दिख रहा है।

 
roxie 2026-03-04

लगता है structured data महत्वपूर्ण है।

 
GN⁺ 2026-03-04
Hacker News टिप्पणियाँ
  • कुछ साल पहले जब John Reilly ने HN पर “How I ruined my SEO” नाम की पोस्ट डाली थी, तब मैंने उसकी मुफ्त में मदद की थी
    उसने उस प्रक्रिया को ब्लॉग में संक्षेपित किया
    चाहें तो इस बार भी मदद करने को तैयार हूँ
    सबसे तेज़ समाधान यह है कि .net साइट के लिए backlink mapping की जाए, और गलत लिंक देने वाले प्रकाशनों को ईमेल भेजा जाए
    अगर आप कहें “यह लिंक नकली साइट पर जा रहा है, असली यह है” तो उम्मीद से ज़्यादा जगहें उसे ठीक कर देती हैं
    सिर्फ़ इसी एक काम से स्थिति बदल सकती है
    इसके अलावा nanoclaw.dev में structured data और schema जोड़ने से search engine और LLM उसे बेहतर पहचान पाएँगे
    व्यावहारिक सलाह को संक्षेप में कहें तो

    1. Google Search Console में nanoclaw.dev को रजिस्टर करें और sitemap submit करें
    2. नकली साइट के backlinks इतने ज़्यादा नहीं हैं, इसलिए रिकवरी पूरी तरह संभव है
    3. GitHub repo के backlinks की quality ऊँची है, इसलिए वहाँ संपर्क करके असली साइट का लिंक जोड़ने के लिए कहना चाहिए
      backlink सूची spreadsheet देखें
    4. Twitter/X, LinkedIn जैसी official social profiles बनाकर Google के knowledge graph को मज़बूत करें
    5. आख़िर में, अगर इस HN थ्रेड में nanoclaw.dev का सीधा लिंक दिया गया होता तो SEO में बहुत मदद मिलती
    • यह सच में काफ़ी उदार प्रस्ताव लगता है
      लेकिन लेखक के नज़रिए से देखें तो Google की बनाई समस्या को खुद जाकर ठीक करना पड़े, यह बात खल सकती है
      अरबों डॉलर वाली कंपनी GitHub पर साफ़ दिख रहे official link को भी अलग न कर पाए, और आख़िरकार किसी व्यक्ति को अपना समय लगाना पड़े — यह अनुचित लगता है

    • यह सोचना ही निराशाजनक है कि ऐसी अनावश्यक SEO मेहनत करनी पड़ती है

    • यह समस्या सिर्फ़ एक साइट की नहीं है
      बहुत सारे open source projects यही समस्या झेल रहे हैं
      बुनियादी तौर पर यह Google को ठीक करना चाहिए

    • बेहतरीन सलाह

    • अच्छा feedback है

  • तीसरे पक्ष के नज़रिए से देखें तो .net version शायद The Register और The New Stack जैसे high-authority publications से लिंक मिलने की वजह से ऊपर आया है
    अभी सिर्फ़ एक हफ़्ता हुआ है, इसलिए Google को सही तरह पहचानने के लिए समय देना होगा
    Google में उस साइट के पक्ष में झुकाव रहने की प्रवृत्ति होती है जिसने किसी विषय को पहले कवर किया हो
    इसलिए समय के साथ ranking समायोजित होने की संभावना ज़्यादा है
    तब तक GitHub की बजाय official website को लिंक करना बेहतर होगा

    • मैंने खुद चेक किया तो सिर्फ़ The Register ने गलत पेज का हवाला दिया था, बाकी लेख GitHub को refer कर रहे थे
      The Register archive
      VentureBeat archive
      The New Stack archive

    • यह दिखाता है कि इंटरनेट पर copied content इतना ज़्यादा है कि ‘जो पहले प्रकाशित हुआ वही original है’ वाला मानदंड हमेशा सही नहीं बैठता

    • यही वजह है कि आज भी search करने पर Java 8 documentation ऊपर दिख जाती है। यह काफ़ी चिढ़ाने वाली बात है

    • समस्या की जड़ यही है कि ‘अभी सिर्फ़ एक हफ़्ता हुआ है’
      Google का algorithm ढेर सारे authority, quality weights से उलझा हुआ है, इसलिए इसे कम समय में बदलना आसान नहीं है

    • अगर आप developer हैं, तो हर project के लिए अपना website page बनाकर रखना अच्छा है
      हो सके तो repo भी self-hosting करना ज़्यादा सुरक्षित है

  • मैं Kagi का paid user हूँ, लेकिन हाल में Kagi में भी AI-generated low-quality results बढ़ गए हैं, इसलिए निराशा हो रही है
    nanoclaw के search results भी Google से लगभग एक जैसे थे

    • मुझे भी कुछ ऐसा ही लगा
      Kagi की customization features अच्छी हैं, लेकिन web खुद ही इतनी low-quality information से भर चुका है कि आख़िरकार किसी भी search engine की एक सीमा है

    • आजकल कोई भी search engine पसंद नहीं आ रहा :(

    • Kagi में nanoclaw search किया तो
      पहले नंबर पर nanoclaw[dot]net,
      दूसरे पर qwibitai का GitHub repository (नकली जैसा),
      तीसरे पर promotional video,
      चौथे पर gavrielc का GitHub जो असली लगता है,
      पाँचवें पर nanoclaw.dev, लेकिन title “Don’t trust AI agents” दिख रहा है
      छठा फिर एक और fork था

  • मैंने कई search engines और AI को टेस्ट करके नतीजे संक्षेप में लिखे
    Google और Brave में official GitHub → fake domain क्रम था,
    DuckDuckGo और Bing में fake domain → official GitHub क्रम था,
    Mojeek में तीसरे पक्ष के लेख प्रमुख थे, और Qwant सबसे खराब था
    वहीं ChatGPT, Gemini, Grok जैसे AI search modes ने ज़्यादातर मामलों में official site को सही पहचाना, और कुछ ने fake site की warning भी दिखाई
    निष्कर्ष यह था कि AI पारंपरिक search से काफ़ी अधिक सटीक था

    • लेकिन results user के हिसाब से अलग-अलग हैं
      मेरे Google में .net पहले नंबर पर है और GitHub दूसरे पर
      ChatGPT 5.2 Auto mode अब भी .net को official site समझ बैठा, लेकिन Thinking mode और Claude ने सही तरह .dev को प्राथमिकता दी

    • AltPower Search में भी यही समस्या दिखी
      लगता है nanoclaw.dev अभी नया domain है, इसलिए indexing अधूरी है
      AltPower, Archive, Cloudflare Radar देखें

    • जानना चाहूँगा कि AI को टेस्ट करने के लिए कौन-सा prompt इस्तेमाल किया गया था

  • ऊपर वाली टिप्पणी में structured data वाली सलाह ही असली कुंजी है
    मैंने भी Organization और SoftwareApplication schema जोड़ने के बाद देखा कि Google ने साइट को बिल्कुल अलग तरीके से समझना शुरू कर दिया
    समस्या यह है कि Google के पास सारे signals पहले से होते हुए भी वह अब भी domain age और backlink count को ज़्यादा महत्व देता है
    आख़िरकार सिस्टम असली निर्माता से पहले domain पकड़ने वाले व्यक्ति को इनाम देता है

    • यह टिप्पणी इतनी स्वाभाविक लगी कि मैं इसे अपने साइट SEO के लिए reference बनाना चाहता था, लेकिन पढ़ते-पढ़ते लगा कि यह शायद LLM द्वारा लिखा गया है, तो उलझन हुई
      क्या यह जाँचना संभव है कि कौन सचमुच इंसान है?
  • आज nanoclaw search करते समय मुझे एक और fake site nanoclawS.io मिली
    वह email इकट्ठा कर रही है, इसलिए खतरनाक है
    ऐसे मामले में Google ranking की चिंता करने से बेहतर है कि साइट को hosting स्तर पर block कराया जाए
    अगर DMCA request डालने लायक कोई copyright element है, तो कोशिश की जा सकती है

    • लेख के मुताबिक Google, Cloudflare और registrar spaceship.com को पहले ही takedown requests भेजी जा चुकी हैं
  • सभी open source developers के लिए मेरी सलाह है: जब भी कोई project public करें, तो misuse की संभावना हमेशा ध्यान में रखें
    दुनिया ऐसे ही चलती है
    open source के लिए आभारी हूँ, लेकिन पहले खुद को सुरक्षित रखना ज़रूरी है

    • खासकर अगर license MIT है, तो Amazon जैसी बड़ी कंपनी fork करके उससे कमाई भी कर सकती है और आपको एक पैसा भी नहीं मिलेगा
      यह charity coding से अलग स्तर की समस्या है

    • इससे जुड़ा एक नियम Hyrum’s Law है
      इसका मतलब है, “अगर API के users काफ़ी ज़्यादा हो जाएँ, तो system का हर behavior किसी न किसी के लिए dependency बन जाता है”

  • SEO में हारना कुछ-कुछ stock market में पैसा गंवाने जैसा है
    system इतना efficient और निर्मम है कि उसे किसी व्यक्ति की शिकायत से कोई फर्क नहीं पड़ता
    आख़िर में रणनीति दोबारा बनाकर और market को समझकर ही आगे बढ़ना पड़ता है

  • @Gavriel के लिए एक सुझाव: NanoClaw trademark registration पर विचार करना चाहिए
    registration या सिर्फ़ application दाखिल कर देने से ही domain registrant, Cloudflare और Google के खिलाफ़ कानूनी प्रतिक्रिया की क्षमता बढ़ जाती है
    UDRP dispute में सामने वाले के bad-faith registration को साबित करना आसान हो जाता है

  • Claw trend पर सवार होना एक चलन था, लेकिन अब मामला यह हो गया है कि कोई आपके नाम का इस्तेमाल करके उस trend पर सवार हो रहा है

    • यह सोचें तो बात विडंबनापूर्ण है कि असली Claw project भी पहले किसी दूसरे product की popularity का फायदा लेकर चला था और बाद में नाम बदला

    • मेरे मन में भी यही बात आई
      यह “ईमानदार साइट को ठगों ने नुकसान पहुँचाया” वाला मामला कम, और ध्यान खींचने की अनंत प्रतिस्पर्धा में रास्ता भटक जाने का मामला ज़्यादा लगता है