बॉट अब असली यूज़र्स की गतिविधियों की नकल पहले से कहीं ज़्यादा कर रहे हैं

(joindatacops.com)

14 पॉइंट द्वारा GN⁺ 2025-10-16 | 2 टिप्पणियां | WhatsApp पर शेयर करें

e-commerce वेबसाइट विज़िटर्स में से 73% के वास्तविक इंसान नहीं, बल्कि परिष्कृत बॉट्स होने की बहुत अधिक संभावना है
मानक analytics tools के लिए ऐसे bot traffic को अलग पहचानना मुश्किल है, जिससे ad performance analysis और marketing ROI की गणना विकृत हो जाती है
Engagement Bot, Cart Abandonment Bot, और social media referral bots जैसे कई पैटर्न में वेबसाइट गतिविधि की बहुत सटीक नकल की जा रही है
bot traffic का एक हिस्सा data collection या वैध automation से आता है, लेकिन इसका बड़ा भाग ad fraud या internal metrics में हेरफेर के लिए होता है
यह समस्या अब किसी एक साइट तक सीमित नहीं, बल्कि पूरे उद्योग की व्यापक और व्यवस्थित चुनौती बनती जा रही है

समस्या की शुरुआत: 0.1% conversion rate का रहस्य

एक e-commerce client की वेबसाइट पर एक महीने में 50,000 visitors आए, लेकिन वास्तविक बिक्री सिर्फ 47 हुई
Google Analytics जैसे analytics platforms में डेटा बहुत सकारात्मक दिख रहा था, लेकिन वास्तविक revenue से उसका संबंध बहुत कम था
हर महीने ads पर 4,000 डॉलर खर्च करने के बावजूद growth और revenue में कोई अनुपात नहीं दिखा
शुरुआत में लगा कि समस्या product में है, लेकिन वेबसाइट traffic data का सीधे विश्लेषण करते हुए असामान्य संकेत मिले
इस समस्या को समझने के लिए वास्तविक यूज़र्स के behavior patterns को मॉनिटर करने वाली tracking script बनाई गई

शुरुआती जांच: traffic की सच्चाई को परखने वाली tracking

सिर्फ clicks गिनने के बजाय वास्तविक user behavior patterns देखने वाला tracking tool विकसित किया गया
- mouse movement: स्वाभाविक curves बनाम मशीन जैसी सीधी movement patterns का विश्लेषण
- scroll patterns: बदलती गति, pauses और reverse scroll बनाम पूरी तरह स्थिर mechanical scrolling
- interaction intervals: clicks, hover और add-to-cart के बीच समय अंतराल में विविधता का मापन
सिर्फ एक हफ्ते में पता चला कि Non-human traffic पूरे traffic का 68% था
यह सामान्य spam नहीं था, बल्कि analytics tools को धोखा देने के लिए बनाए गए चालाक बॉट्स थे

समस्या का फैलाव: अलग-थलग घटना नहीं, उद्योग-स्तरीय पैटर्न

marketing forums और Discord groups में दूसरे e-commerce operators से पूछा गया: "क्या आपने traffic और sales के बीच ऐसा फर्क देखा है?"
200 से अधिक छोटे और मध्यम e-commerce websites पर tracking script लगाने की अनुमति लेकर 6 महीनों तक जांच की गई, जिसमें औसतन 73% traffic नकली (bot) निकला
यह किसी एक कंपनी की समस्या नहीं, बल्कि पूरे digital commerce ecosystem का संरचनात्मक मुद्दा है

आधुनिक ad fraud की संरचना: traffic प्रकारों का विश्लेषण

Engagement Bot
- ऐसे बॉट्स जो analytics reports को बेहतर दिखाने के लिए quality visitors के behavior को simulate करते हैं
- page scroll, product पर cursor hover, internal link clicks जैसे जटिल interactions करते हैं
- इनकी घातक कमी: पूर्ण consistency
  - हर product description page पर ठीक 11~13 सेकंड रुकना
  - scroll speed हमेशा 3.2 pages प्रति सेकंड रहना
- इंसानी behavior अनियमित होता है, लेकिन ये बॉट्स लगभग clinical precision दिखाते हैं
Cart Abandonment Bot
- वही product cart में जोड़कर 4 मिनट तक रखता है, फिर छोड़ देता है, और यह प्रक्रिया हर दिन दर्जनों बार दोहराता है
- अलग-अलग IPs और sessions से इसे दोहराया जाता है, जिससे cart abandonment rate जैसे metrics को जानबूझकर विकृत करना या internal recommendation algorithms को manipulate करना उद्देश्य हो सकता है
Phantom Social Media Visitor
- ऐसा traffic जो analytics tools में Instagram, TikTok आदि से आया हुआ दिखाई देता है
- इनमें से लगभग 64% page पर आने के बाद ठीक 1.8 सेकंड रुकते हैं और फिर निकल जाते हैं
- बिना scroll या click किए तुरंत bounce कर जाते हैं, लेकिन फिर भी "social media visitors" के रूप में गिने जाते हैं
- ad fraud का मुख्य तत्व: नकली engagement बेचने वालों के लिए traffic भेजने का "proof"

सभी बॉट्स दुर्भावनापूर्ण नहीं होते: वैध data scraping

e-commerce data industry के एक insider के अनुसार: हर दिन 70 million retail webpages scrape किए जाते हैं
यह वैध business intelligence उद्देश्यों के लिए भी होता है
- Amazon जैसे बड़े retailers stock खत्म होने पर vendors को हमेशा सूचित नहीं करते
- brands अपने products की निगरानी के लिए data scraping services पर पैसे खर्च करते हैं
- inventory levels की जांच, buy box competition analysis, और product descriptions की सटीकता की पुष्टि
- region और mobile devices के हिसाब से search ranking tracking
- target audiences के अनुसार banner ads analysis
Kurzgesagt के एक वीडियो के मुताबिक पूरे internet traffic का लगभग 50% बॉट्स हैं
इसका एक हिस्सा वैध competitive analysis और price monitoring है, लेकिन बड़ा हिस्सा ad budgets खत्म कराने वाला fraudulent traffic है

digital advertising की टूटी हुई economics

एक client हर महीने Google Ads पर 12,000 डॉलर खर्च कर रहा था
advanced bot traffic detection और filtering लागू करने के बाद:
- reported traffic 71% गिर गया
- CFO शुरुआत में चौंक गया
- लेकिन वास्तविक revenue 34% बढ़ गया
असली conversion rate optimization (CRO) प्रयास शुरू से काम कर रहे थे, लेकिन वे fake clicks की बाढ़ में दब गए थे
हजारों डॉलर ऐसे robots को ads दिखाने में बर्बाद हो रहे थे जिन्हें कभी खरीदारी न करने के लिए program किया गया था
marketing ROI तुरंत "भयानक" से "बेहतरीन" हो गया
ad platforms की प्रतिक्रिया
- बड़े ad platforms से बातचीत में जैसे ही click fraud या bot traffic का ज़िक्र हुआ, उनका रवैया बदल गया
  - "हमारी AI detection industry में सबसे बेहतर है"
  - "हम ad fraud को बहुत गंभीरता से लेते हैं"
- एक प्रतिनिधि ने अनौपचारिक रूप से माना: "सबको पता है"
  - "अगर सही तरह से filtering कर दी जाए, तो एक रात में revenue 40% गिर जाएगा और investors घबरा जाएंगे"
- यह बहुत बड़ा conflict of interest है: ad platforms को प्रति click या impression revenue मिलता है, चाहे वह potential customer हो या click-farm server

क्या आप robots को ads दिखा रहे हैं? fake traffic detection के लिए व्यावहारिक गाइड

1. traffic spike बनाम sales data audit
- क्या traffic spike sales spike से मेल खाता है?
- अगर promotion चलाने पर traffic दोगुना हो गया लेकिन sales स्थिर रहीं, तो fraudulent traffic की संभावना बहुत अधिक है
2. user behavior metrics का विश्लेषण
- "बहुत ज़्यादा perfect" दिखने वाले numbers खोजिए
- क्या मुख्य landing pages पर "average time on page" हर महीने अस्वाभाविक रूप से स्थिर रहता है?
- वास्तविक इंसानी behavior अनियमित और बदलने वाला होता है
3. geographic data segmentation
- क्या ऐसे देशों से काफी traffic आ रहा है जहाँ आप shipping नहीं करते?
- अगर ऐसे visitors convert नहीं करते, तो यह low-quality या fake traffic का बड़ा संकेत है
4. referral sources की जांच
- अपने top traffic sources का बारीकी से विश्लेषण करें
- अगर referral sites अप्रासंगिक या low-quality लगती हैं, तो वे traffic exchange network का हिस्सा हो सकती हैं
- ऐसे "ghost referrals" ढूँढिए जहाँ साइट पर वास्तव में आपका link मौजूद ही नहीं है
5. अपनी intuition पर भरोसा करें
- अगर numbers अजीब लग रहे हैं, तो संभव है कि सचमुच कोई समस्या हो
- अपने customer base को समझने वाले business owner की intuition बॉट detection का मूल्यवान tool हो सकती है

कठोर निष्कर्ष: digital sandcastle

एक startup founder ने "user growth" metrics के आधार पर 2 million डॉलर की funding जुटाई
बाद में पता चला कि उन metrics का 80% हिस्सा bots था
अब सच स्वीकार करने पर कंपनी और investors के रिश्ते खतरे में पड़ सकते हैं, इसलिए सब कुछ सामान्य होने का दिखावा किया जा रहा है
छिपी हुई bot economy
- ad platforms बॉट्स को impressions बेचते हैं
- कंपनियाँ metrics फुलाने के लिए fake traffic खरीदती हैं
- analytics firms इन bot activities को ईमानदारी से report करती हैं
- पूरा उद्योग एक सामूहिक दिखावे में शामिल है, क्योंकि सच स्वीकार करने पर यह नाज़ुक सिस्टम ढह सकता है
अंतिम दृष्टि
- internet का आधे से ज़्यादा हिस्सा एक भ्रम बन चुका है, जहाँ bots दूसरे bots के लिए प्रदर्शन कर रहे हैं
- AI और automation के और परिष्कृत होने के साथ यह अनुपात हर दिन बढ़ रहा है
- अब सवाल यह नहीं कि "क्या आपका business प्रभावित हो रहा है?"
- असली सवाल है: "जब यह digital sandcastle आखिरकार ढह जाएगा, तब क्या होगा?"

2 टिप्पणियां

t7vonn 2025-10-16

अब सिर्फ headless bots ही नहीं, बल्कि comet browser जैसे agent bots भी आ गए हैं, इसलिए detection और भी ज़्यादा मुश्किल हो जाएगा।

GN⁺ 2025-10-16

Hacker News राय

मैं एक marketing agency चलाता हूँ, और एक client के analytics data का कोई मतलब नहीं बन रहा था (50,000 visitors पर 47 sales), इसलिए मैंने गहराई से जांच शुरू की। फिर मैंने user behavior track करने के लिए एक simple script बनाई और 200 से ज़्यादा छोटे और मध्यम आकार के ecommerce sites का analysis किया। औसतन, कुल visit traffic का 73% bot traffic था, जिसे standard analytics tools में असली visitor के रूप में गिना जा रहा था। अब bots सचमुच इंसानों जैसा behavior imitate करने में बेहद माहिर हो गए हैं। मैंने अपने सीधे देखे गए अजीब patterns और adtech industry के लोगों के साथ हुई off-the-record बातचीत भी संकलित की है। चौंकाने वाली बात यह है कि यह bot traffic एक खुला रहस्य है, जिसके बारे में सब जानते हैं लेकिन कोई खुलकर बात नहीं करता। ऐसा लगता है कि पूरा सिस्टम ही इन bots पर निर्भर होकर चल रहा है। जानना चाहता हूँ कि क्या दूसरे developers, founders, या marketers ने भी ऐसा ही data mismatch देखा है
- पहले मैं Switzerland के yellow pages में काम करता था, जहाँ paying customers के लिए एक dashboard था जिसमें वे अपने business page के visitor numbers देख सकते थे। हमारी dev team ने bot traffic filter कर दिया तो numbers 50% से ज़्यादा गिर गए। एक दिन भी नहीं बीता था कि business side से filter हटाने का आदेश आ गया। आखिर में bots को भी असली लोग मान लिया गया
- सच कहें तो, अगर यह सब fraud भी हो, तो क्या फर्क पड़ता है? अगर 47 असली purchases हुईं, तो उस अवधि का ad spend कितना था, और पहले-बाद के data से तुलना करके campaign की success जानी जा सकती है। Outdoor advertising या bus ads में भी यह नहीं देखा जाता कि कौन देख रहा है, या सचमुच इंसान देख रहा है या नहीं। आखिर में मायने असली numerical impact का है
- मैं web analytics consulting करता हूँ, और 2021 में एक global logistics company के अजीब traffic patterns की जांच की थी। उसका सार मैंने अपने blog पर लिखा है इस लेख में. Bot traffic की समस्या बहुत लंबे समय से है, और इसे रोकने के लिए कई उभरती हुई "ad fraud detection services" आई हैं, लेकिन अब तक मुझे शायद ही कोई service सच में उपयोगी लगी हो। "इसे कैसे हल करें?" यह सवाल हमेशा अंत में बचा रह जाता है, लेकिन bots को पूरी तरह रोकने का तरीका किसी को नहीं पता। ज़्यादातर consumer Google, Facebook, Instagram, TikTok, LinkedIn जैसे major platforms पर हैं, और ऐसे alternative ad networks जिनमें bots कम हों, व्यावहारिक रूप से मौजूद नहीं हैं। सबको पता है कि इसका एक हिस्सा नकली है, फिर भी वे वही traffic खरीदते रहते हैं। यह स्थिति तभी बदलेगी जब अरबों डॉलर ad revenue कमाने वाली big tech कंपनियों को मौजूदा व्यवस्था बचाए रखने से ज़्यादा उसे बदलने का incentive मिलेगा। अभी तो उन्हें इसकी परवाह करने की भी जरूरत महसूस नहीं होती। "मैं advertising पर जो पैसा खर्च करता हूँ, उसका आधा बर्बाद होता है। समस्या यह है कि मुझे नहीं पता कौन-सा आधा।" - John Wanamaker
- "अच्छे bots" वाले traffic की बात दिलचस्प थी। मेरी जांच के दौरान data industry के एक व्यक्ति ने बहुत बड़ा संकेत दिया: उसकी company हर दिन 7 करोड़ retail web pages scrape करती थी। यह वैध bot traffic का बहुत बड़ा स्रोत है। उदाहरण के लिए, Amazon stock खत्म होने पर suppliers को notify नहीं करता, इसलिए brands data scraping services का उपयोग करके अपने products की stock status, 'buy box' dominance की प्रतिस्पर्धा, product descriptions की adequacy, search ranking, यहाँ तक कि कौन-सा banner ad किस audience को दिख रहा है, यह सब crawl करते हैं। ऐसे 'अच्छे bots' भी नजरिए के हिसाब से अलग दिख सकते हैं। मेरी site को competitor scrape करे तो मुझे बुरा लगेगा, लेकिन मैं खुद market data collect करूँ तो अच्छा लगेगा। किसी ने उसे program किया है और चला रहा है, यानी उसके लिए वह फायदेमंद bot है। Content creators AI scraping को बुरा मानते हैं, लेकिन AI बनाने वाले उसे अच्छा मानते हैं। Price comparison sites अपने crawlers को जायज़ मानते हैं, retailers उन्हें नापसंद करते हैं। 'अच्छा' या 'बुरा' bot traffic आखिर नजरिए का मामला है
- इस बात से सहमत हूँ कि पूरा सिस्टम bots पर टिका हुआ है। मैं पहले कभी बहुत rebellious नहीं था, लेकिन शुरुआती internet optimism का जो एक हिस्सा मेरे भीतर बचा है, वह advertising model को बिखरते देखना चाहता है। सच तो यह है कि ads अगर 'सामान्य' तरीके से भी काम करें, तब भी उनमें मूल रूप से exploitation और deception की गंध रही है। जैसे: "अगर तुम यह product नहीं खरीदोगे, तो तुम्हारे दोस्त तुम्हें नापसंद करेंगे" जैसी messaging
इस लेख की writing style दिलचस्प है। "सिर्फ X नहीं बल्कि..." वाला pattern, bold emphasis, bullet lists वगैरह — यह कहीं देखा-भाला ChatGPT style लगता है। बेशक ChatGPT की मदद लेना गलत नहीं है, लेकिन लेख का content विडंबना से खुद AI-जैसी writing में है। अगर असली writer की शैली पहले से ऐसी है, तो शायद इसका मतलब यह है कि ChatGPT को भी ऐसी ही शैली पर tune किया गया है। सोच रहा हूँ, क्या adtech industry की communication वैसे ही होती है?
- उल्टा, इस लेख की असली विडंबना यह है कि यह इंसान द्वारा "template जैसी भाषा" के सही इस्तेमाल का उदाहरण होते हुए भी सतह पर AI-जैसा दिखता है, इसलिए गलत समझा जाता है। "यह X नहीं, Y है" जैसी रचना का साफ उद्देश्य होता है: लेखक जानता है कि पाठक इसे X समझेगा, इसलिए उसे Y के नजरिए से देखने को मजबूर करता है। लेख में "मैंने सिर्फ clicks नहीं गिने, behavior देखा", "ये सिर्फ site पर आकर निकल जाने वाले bots नहीं, बल्कि इंसानी behavior imitate करने वाले bots हैं" जैसी पंक्तियाँ इसी तरह काम करती हैं। यह पाठक की अपेक्षा और वास्तविकता को स्पष्ट रूप से अलग करती हैं। AI writing traits और इंसानों की सार्थक writing के बीच फर्क का अध्ययन करना दिलचस्प होगा। बाद में शायद higher education या hiring में सचमुच ऐसे सवाल उठें कि AI और इंसान को इस आधार पर कैसे अलग किया जाए
- "यह एक simple yet devastating problem से शुरू हुआ" पढ़ते ही मेरी रुचि कम हो गई। उसके बाद "मुझे अजनबी और असहज महसूस हुआ" जैसी लाइनें भी असरहीन लगीं। ऊपर से ऐसा भी लगता है कि लेखक आखिरकार कोई अलग ad tool बेचने वाली कंपनी से है
- ऐसे लेखों में विडंबना और ज़्यादा लगती है। फिर भी अच्छी बात यह है कि लोग अब इस तरह की सतही writing को जल्दी पहचानकर नज़रअंदाज़ करने लगे हैं। Startups कहते हैं fail fast, लेकिन मैं AI-generated content को fast detect करके skip करना चाहता हूँ
- लेख में AI-जैली खूबियाँ तुरंत पकड़ लीं और सीधा comments तक आ गया। अगर कोई लेख साफ़ तौर पर AI-generated लगे, तो यह संकेत है कि उसे न ठीक से लिखा गया है न edit किया गया है, इसलिए उसकी credibility अपने-आप गिर जाती है
- तस्वीर भी AI-generated लगती है, या कम से कम बेढंगे clipart जैसी
मैंने 15 साल adtech industry में काम किया है, और मेरा मानना है कि Google/FB जैसी बड़ी कंपनियाँ भी users को गुमराह करती हैं। वे double tracking की अनुमति नहीं देतीं और कहती हैं कि सिर्फ उनके खुद के numbers पर भरोसा करो, और जब click IP देखते हैं तो कभी-कभी FB/Google data center IP दिखते हैं। वहाँ से आने वाला traffic भी असल में कई बार ऐसा खेल होता है जिसमें algorithm उन users को पकड़कर, जो वैसे भी मेरी site पर खरीदारी करने वाले थे, उसे अपनी ad performance का श्रेय दे देता है। कुछ कंपनियाँ impact metrics सही ढंग से करने की कोशिश करती हैं, लेकिन वे बहुत कम हैं। Ads दिखाने वाली sites को सिर्फ users की झुंझलाहट मिलती है, कोई असली लाभ नहीं। Advertisers पैसा खर्च करते हैं और बदले में कुछ खास नहीं पाते। आखिर में फायदा सिर्फ बीच के players को होता है
- Google ads करना कुछ वैसा है जैसे मेरी दुकान के सामने pamphlet बाँटने वाले किसी व्यक्ति को पैसे देना। हो सकता है मेरे visitors का बड़ा हिस्सा Google ads के pamphlet के जरिए आया हो, लेकिन उन visitors में सचमुच कितने नए customers हैं, यह पता नहीं
- Facebook Ads और SA360 3rd party tracking support करते हैं, और अलग-अलग third-party analytics tools भी इस्तेमाल किए जा सकते हैं। यह कहना कि IP FB/Google data centers के दिखते हैं, बहुत oversimplified है, और मैंने यह पहली बार सुना है। क्या बड़ी कंपनियों के पास VPN नहीं होंगे? और "algorithm organic traffic चुरा लेता है" वाली बात भी समझ नहीं आती। मैं भी 10 साल से ज़्यादा समय से industry में हूँ, लेकिन यह तर्क मुझे विश्वसनीय नहीं लगता। 15 साल का अनुभव होने पर भी कोई industry और technology को ठीक से न जानता हो, ऐसा हो सकता है
मुझे लगा था कि industry में सब लोग जानते हैं कि traffic numbers आम तौर पर मनगढ़ंत होते हैं, और ad click data का आधे से ज़्यादा हिस्सा fraud होता है। इसलिए यह अजीब लगता है कि "accurate ad spend analysis" का दावा करने वाला OP यह बात अब जाकर समझ रहा है। यह हिस्सा नया नहीं है, इसलिए शक होता है कि क्या OP को सच में अभी पहली बार पता चला। दूसरी ओर, जिस तरह उसने अलग-अलग bot patterns को classify किया, वह दिलचस्प था; उस पहलू पर मैंने विस्तार से लिखी हुई चीज़ कम देखी है
- industry के कुछ लोग यह बात बहुत पहले से जानते थे, लेकिन स्थिति लगातार और गंभीर होती गई है। पिछले 10 साल marketing teams के साथ काम करते हुए मेरी theory यह बनी है कि ज़्यादातर लोग numbers पर बिना आलोचनात्मक सोच के भरोसा कर लेते हैं। खासकर जब metrics को हर साल exponentially बढ़ना ही चाहिए, तभी team टिकती है, तो inflated numbers उल्टा अच्छे लगते हैं, और जो बिक्री नहीं होती उसका दोष sales team पर डाल देना आसान हो जाता है
- मेरे पिछले startup में भी marketing और dev resources झोंककर conversion funnel optimization किया गया, लेकिन असल में business direction ही गलत थी। अगर हम बेकार के data noise में न फँसे होते, तो शायद जल्दी pivot कर सकते थे
- यह समस्या 10 साल से ज़्यादा समय से industry में सबको पता है। कुछ हद तक यह datacops कंपनी का marketing लेख भी है
- कुछ लोग कह रहे हैं, "क्या, OP को अब जाकर समझ आया!?" लेकिन लगता है कि यह company (Datacops) अभी हाल में शुरू हुई है। संभवतः उन्होंने product launch timing के साथ इस मुद्दे पर लेख निकाला है। संदर्भ
- 50,000 traffic पर 47 conversions देखें तो मेरे हिसाब से शायद नकली हिस्सा इससे भी ज़्यादा बढ़ चुका है। पहले आधा fraud होता था, अब तो ऐसा लगता है कि असली users बहुत मामूली अल्पसंख्या बनकर रह गए हैं
अगर आप Facebook ads चला रहे हों और अचानक fraud traffic आने लगे, तो सवाल उठता है कि ऐसे bots कौन चला रहा है और क्यों। Facebook के पास ऐसा motive हो सकता है, लेकिन अगर पकड़ा गया तो उसकी भारी कीमत होगी, इसलिए लगता नहीं कि वह खुलकर ऐसा करेगा। Competitors? सिर्फ मेरा budget खत्म करने के लिए यह तकनीकी रूप से बहुत advanced लगता है, और यह भी समझ नहीं आता कि क्या कोई सच में किसी shadowy operator को hire करता है। Ad agency? अगर data पूरी तरह गड़बड़ होगा तो client तुरंत refund माँगेगा, इसलिए वह भी कम संभावित लगता है। तो फिर कौन, और किस मकसद से?
- शायद ये बस ऐसे bots हों जो असली इंसान जैसे दिखने के लिए simulation चलाते हों। वे सिर्फ मेरे ads पर click नहीं करते, बल्कि अंधाधुंध real users का behavior imitate करने की कोशिश कर रहे हों
- Facebook ads में pay-per-click के अलावा actual sales या conversions पर payment models भी होते हैं, इसलिए उस दिशा में incentives ज़्यादा साफ़ दिखते हैं
- methbot case देखने की सलाह दूँगा। ज़्यादातर मामलों में bots ad revenue कमाने के लिए चलाए जाते हैं: algorithm को trick करके traffic को अपनी ही डाली हुई content/pages की ओर धकेलना, और फिर असली इंसानों जैसा दिखाकर और ज़्यादा ad budget खींचना। यह संरचनात्मक रूप से FB/Google के लिए भी पूरी तरह filter करना मुश्किल बना देता है
- लोग कहते हैं, "क्या Facebook ऐसा करेगा?" लेकिन इतिहास बताता है कि इस तरह की metrics calculation में "company पर भरोसा" करना हमेशा मूर्खता रही है। यह हर company पर लागू होता है। अगर expected profit, cost + पकड़े जाने के risk से बड़ा हो, तो कंपनी वह काम करेगी
- यह भी हो सकता है कि Facebook खुद ऐसा न कर रहा हो; लेकिन जब तक advertisers ads खरीदते रहेंगे, तब तक इस समस्या की परवाह करने का उसके पास खास कारण नहीं होगा
काश script public होती। मैं देखना चाहता हूँ कि method सही था या नहीं, और कहीं ऐसा तो नहीं कि ad blockers या JS disabled वाले normal users को bots मान लिया गया हो। 73% भी मुझे चौंकाने वाला नहीं लगता; मैं तो इससे भी ज़्यादा की उम्मीद करूँगा। मेरे लिए सबसे प्रभावशाली बात यह थी कि जब ad platform sales reps से bots और click fraud की बात करो तो बातचीत अचानक सख्त corporate language में बदल जाती है। एक sales rep जिसे मैं पहले अच्छी तरह जानता था, उसने off the record कबूला था: "हम सब जानते हैं। सब जानते हैं। लेकिन अगर हम इसे सच में पूरा filter कर दें, तो एक दिन में revenue 40% गिर जाएगा और investors हंगामा कर देंगे।"
- अगर marketing staff के incentives vanity metrics पर बने हों, तो conversion problem को funnel के बहुत बाद के चरण की समस्या समझा जाता है। यहाँ तक कि venture startups के पास भी investors को फुलाए हुए numbers दिखाने के लिए bot signups को जानबूझकर बने रहने देने का incentive साफ़ मौजूद है
- जब कोई कहे कि "अगर सही से filter किया तो revenue का 40% उड़ जाएगा", तो मन में आता है कि क्या यह class action lawsuit का मामला नहीं बनता
2000s की शुरुआत में Lycos की ad operations team में काम करते समय भी मैंने internal audit में देखा था कि bots का हिस्सा 25~75% तक था। तब भी इसे रोकने की कोशिश हुई, लेकिन कुछ हासिल नहीं हुआ, और आज भी वही हाल है। Online advertising ज़्यादातर पैसे की बर्बादी है। यह देखने में आर्थिक गतिविधि पैदा करती लगती है, लेकिन असल में समय और संसाधनों की बर्बादी है
- advertising शुरू से ही अधिकतर पैसे की बर्बादी रही है; समस्या यह पता लगाने की है कि कौन-सा हिस्सा काम करता है। Internet advertising ने ज़्यादा accurate targeting और measurable performance का वादा किया था, लेकिन व्यवहार में यह उतना सफल नहीं हुआ। Ad effectiveness समझने के लिए ग्राहकों से सीधे पूछना चाहिए कि वे आपके बारे में कैसे जान पाए, और ad budget adjust करते हुए बदलाव देखना चाहिए। लेकिन इसमें समय बहुत लगता है, और इसके अलावा भी कई तरह की गलतियाँ हो सकती हैं। उदाहरण के लिए, ads खूब चलाकर traffic तो आ जाता है, लेकिन service या setup पर्याप्त न हो तो customers छूट जाते हैं, या coupon campaign से इतना traffic आ जाए कि आप संभाल न सकें। लेख में 50,000 visitors, 47 sales, और $4000 ad spend का ज़िक्र है, लेकिन यह साफ़ नहीं कि यह total traffic था या सिर्फ ad traffic। Performance का आकलन visitor count या sales count से नहीं, बल्कि net profit जैसे मूल metrics से करना चाहिए। अगर प्रति sale $500 net profit बचता है, तो $4000 ad spend पर 47 sales ठीक है; लेकिन अगर सिर्फ $1 profit है, तो यह गंभीर समस्या है
चूँकि लेख में bot defense को विस्तार से नहीं बताया गया, मैं कुछ जोड़ना चाहूँगा: अगर आप bot prevention को कड़ा करते हैं (जैसे CAPTCHA), तो real users का drop-off बहुत बढ़ जाता है। Conversion rate पर इसका गंभीर नकारात्मक असर पड़ता है। जैसे-जैसे bots और इंसानों जैसे होते जा रहे हैं, मुझे लगता है इस समस्या को analytics और attribution stage पर सुलझाना चाहिए, usability खराब करके नहीं
- bots दो तरह के होते हैं। एक वे जो DDoS की तरह site पर सीधा बोझ डालते हैं, और दूसरे वे जो ऐसा नहीं करते लेकिन परेशान करते हैं। दूसरी category को block करने की जरूरत नहीं; उन्हें analytics tool में चुपचाप exclude करना सबसे असरदार तरीका है
नीचे मेरा खुद का देखा हुआ एक वास्तविक उदाहरण है
```
고급 봇 트래픽 필터링을 적용한 후, 보고된 트래픽이 71% 감소함
하지만 매출 보고서에선 오히려 실제 매출이 34% 증가함
전환율 최적화(CRO) 시도는 원래 효과가 있었는데, 수많은 가짜 클릭에 묻혀 방해받은 것이었음
그들은 마케팅을 못 한 게 아니라, 단지 광고비를 로봇에게 쏟아붓고 있었던 것임
하루아침에 마케팅 ROI가 "엉망"에서 "최상"으로 바뀜
```
लेकिन मेरी जिज्ञासा यह है कि फिर ऐसी bot filtering सीधे ad spend कम होने से कैसे जुड़ती है? उदाहरण के लिए, क्या Google Ads को सीधे बताया जा सकता है कि "इन clicks के पैसे नहीं देने"? या फिर targeting को ही बदलकर bots से बचा गया?
- मैं कल्पना कर सकता हूँ कि bot traffic block करने से retargeting असली लोगों पर ज़्यादा सटीक ढंग से खर्च होती हो, इसलिए conversions बढ़ जाते हों
- शायद filtering system अगर तय कर ले कि "यह bot है", तो उसे ad दिखाया ही न जाए
- Lookalike और remarketing audiences बनाते समय अगर bots मिल जाएँ, तो Facebook जैसे platforms को गलत signals जा सकते हैं। और Google Ads में आप यह नहीं कह सकते कि किसी खास click के लिए पैसा नहीं देना
मैंने पहले भी ऐसा ही एक लेख देखा था जिसमें दावा किया गया था कि "web advertising market लगभग पूरी तरह fake/fraud/bot आधारित है, और सारी companies व industry उसे नज़रअंदाज़ करते हुए बनाए रखती हैं"। बहुत-सी jobs, companies, और पूरा उद्योग इस बात पर टिका है कि उस सच्चाई को खुलकर स्वीकार न किया जाए
- मुझे भी वह लेख याद है। पहले तो लगा यह उसी का दोहराव है, लेकिन तारीख देखी तो यह नया लेख निकला। शायद यह कोई अजीब mirroring phenomenon हो (Mandela effect)

बॉट अब असली यूज़र्स की गतिविधियों की नकल पहले से कहीं ज़्यादा कर रहे हैं

समस्या की शुरुआत: 0.1% conversion rate का रहस्य

शुरुआती जांच: traffic की सच्चाई को परखने वाली tracking

समस्या का फैलाव: अलग-थलग घटना नहीं, उद्योग-स्तरीय पैटर्न

आधुनिक ad fraud की संरचना: traffic प्रकारों का विश्लेषण

Engagement Bot

Cart Abandonment Bot

Phantom Social Media Visitor

सभी बॉट्स दुर्भावनापूर्ण नहीं होते: वैध data scraping

digital advertising की टूटी हुई economics

ad platforms की प्रतिक्रिया

क्या आप robots को ads दिखा रहे हैं? fake traffic detection के लिए व्यावहारिक गाइड

1. traffic spike बनाम sales data audit

2. user behavior metrics का विश्लेषण

3. geographic data segmentation

4. referral sources की जांच

5. अपनी intuition पर भरोसा करें

कठोर निष्कर्ष: digital sandcastle

छिपी हुई bot economy

अंतिम दृष्टि

संबंधित पढ़ाई

2 टिप्पणियां

Hacker News राय