1 पॉइंट द्वारा GN⁺ 2025-11-07 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Archive.today अब अमेरिकी FBI की जांच के दायरे में है, और अदालत के आदेश के तहत डोमेन प्रदाता Tucows को यूज़र डेटा जमा करना पड़ सकता है
  • आदेश में पता, एक्सेस जानकारी, पेमेंट जानकारी सहित व्यापक डेटा देने की मांग की गई है, और पालन न करने पर प्रतिबंधात्मक कार्रवाई का उल्लेख है
  • Archive.today एक ऐसी सेवा है जो 10 साल से अधिक समय से वेबपेज स्नैपशॉट स्टोर करती आ रही है, और नियमन से बचाव और गुमनामी के कारण इसका इस्तेमाल पेड कंटेंट को बायपास करने में भी होता रहा है
  • FBI की रुचि का कारण स्पष्ट नहीं किया गया है, लेकिन कॉपीराइट मुद्दे, ऑपरेटर की उत्पत्ति, फंडिंग के स्रोत जैसी बातें संभावित जांच के दायरे में हैं
  • यह मामला गुमनाम वेब आर्काइव सेवाओं और law enforcement एजेंसियों के बीच टकराव का एक उल्लेखनीय उदाहरण माना जा रहा है

Archive.today और FBI जांच का सारांश

  • Archive.today 10 साल से अधिक समय से चल रही वेबपेज स्नैपशॉट स्टोरेज सेवा है, जो Internet Archive की Wayback Machine जैसी है, लेकिन इस पर नियामकीय या कानूनी सीमाएं लगभग नहीं हैं
    • यूज़र पुराने वेबपेज देख सकते हैं, और इसका उपयोग अक्सर पेड आर्टिकल या paywall को बायपास करने के लिए किया जाता है
    • माना जाता है कि यह सेवा donation और अपने फंड से चलती है, और ऑपरेटर की पहचान सार्वजनिक नहीं है
  • FBI ने हाल ही में अदालत के आदेश के जरिए Tucows से डेटा जमा करने की मांग की है
    • आदेश में Archive.today के ग्राहक डेटा, पते, एक्सेस रिकॉर्ड, पेमेंट डिटेल्स शामिल हैं
    • यदि Tucows आदेश का पालन नहीं करता तो उस पर कार्रवाई की जा सकती है
    • आदेश की प्रामाणिकता की अभी पुष्टि नहीं हुई है

Archive.today की हालिया गतिविधि और ‘Canary’ पोस्ट

  • Archive.today के आधिकारिक X (पूर्व Twitter) अकाउंट ने एक साल से अधिक समय की चुप्पी के बाद अक्टूबर के आखिर में “Canary” शब्द और URL वाला एक पोस्ट डाला
    • ‘canary’ उस पक्षी को कहा जाता है जिसे खदानों में जहरीली गैस की चेतावनी के लिए इस्तेमाल किया जाता था, इसलिए इसे खतरे के संकेत के रूपक के रूप में देखा जा रहा है
  • पोस्ट के साथ जोड़ी गई PDF फाइल में FBI का अदालत आदेश शामिल है
    • यह दस्तावेज़ कैसे मिला, इसकी पुष्टि नहीं हुई है

FBI की रुचि की पृष्ठभूमि और संभावित जांच बिंदु

  • FBI को Archive.today में दिलचस्पी क्यों है, यह अदालत के आदेश में स्पष्ट नहीं किया गया
    • लेख में कॉपीराइट उल्लंघन, अस्पष्ट फंडिंग, ऑपरेटर की उत्पत्ति, तकनीकी संचालन का तरीका जैसी बातों को संभावित जांच कारण बताया गया है
  • Archive.today तक archive.is, archive.ph जैसे कई डोमेन से पहुंचा जा सकता है

ऑपरेटर की पहचान पर विरोधाभासी जांच निष्कर्ष

  • 2023 में फ़िनलैंड के ब्लॉगर Janni Patokallio ने दावा किया कि Archive.today IP address बदलने वाले botnet का इस्तेमाल कर anti-scraping सिस्टम को बायपास करता है
    • उनका कहना था कि ऑपरेटर संभवतः रूस-आधारित हो सकता है
  • 2024 की एक अन्य निजी जांच में न्यूयॉर्क के एक software developer को ऑपरेटर बताया गया
    • इस जांच में निष्कर्ष निकाला गया कि पूर्वी यूरोप से जुड़े संकेत गलत सुराग थे

इस मामले का महत्व

  • FBI का अदालत आदेश दिखाता है कि गुमनामी और कानूनी gray area में काम करने वाली वेब आर्काइव सेवाओं पर अंतरराष्ट्रीय law enforcement का दबाव बढ़ रहा है
  • Archive.today आगे भी चालू रह पाएगा या नहीं, और डेटा सुरक्षा का क्या होगा, इस पर ध्यान केंद्रित है
  • मूल लेख जर्मन संस्करण से अनुवादित होकर heise online के अंग्रेज़ी संस्करण में प्रकाशित हुआ था

1 टिप्पणियां

 
GN⁺ 2025-11-07
Hacker News टिप्पणियाँ
  • हमें डेटा को संरक्षित रखना चाहिए। FBI डेटा को खत्म करना चाहती है
    मेरा मानना है कि इंसानों के पास ज्ञान पर मानवाधिकार होना चाहिए। इसका मतलब निजी जानकारी (जैसे doxxing) नहीं, बल्कि मानवता के ज्ञान से है
    मौजूदा क़ानून बहुत बड़ी कंपनियों के पक्ष में बनाए गए हैं, लेकिन क़ानून को इंसानों के ज्ञान तक पहुँच के अधिकार को सीमित करने का औज़ार नहीं बनना चाहिए
    Wikipedia ठीक है, लेकिन वहाँ बहुत से लेख ज़रूरत से ज़्यादा जटिल होते हैं और केवल एक ही दृष्टिकोण रखते हैं, इसलिए समझना मुश्किल होता है

    • ऐतिहासिक रूप से देखें तो FBI ने जो काम किए हैं, उनमें यह Top 100 बुरे कामों में भी नहीं आएगा
    • मेरा मानना है कि इंसानों को जो सीखा है उसे स्वतंत्र रूप से साझा करने का प्राकृतिक अधिकार है। हाँ, रचनाकारों को कुछ समय के लिए सीमित एकाधिकार देना ठीक है, लेकिन मौजूदा copyright सुरक्षा अवधि बहुत ज़्यादा है
    • archive.is के डिफ़ॉल्ट लिंक छोटे रूप में होते हैं, इसलिए अगर साइट गायब हो जाए तो सारे लिंक टूट जाएँगे। यह डिज़ाइन-स्तर का जोखिम भी सही नहीं है
    • मैं सहमत हूँ कि ज्ञान पूरी मानवता का है। लेकिन अगर ऐसा है, तो बड़ी कंपनियाँ पूरे इंटरनेट को scrape करें तो उस पर नाराज़ भी नहीं होना चाहिए
    • FBI को डेटा से नफ़रत नहीं है, उन्हें वह सिर्फ़ तभी पसंद है जब पहुँच सिर्फ़ उन्हीं के पास हो
  • यह समझ नहीं आता कि अमेरिका Silk Road ड्रग डीलरों को माफ़ कर दे और दूसरी ओर copyright उल्लंघन करने वालों के पीछे पड़े। ऊपर से अगर व्यक्ति रूसी नागरिक है, तो jurisdiction भी अस्पष्ट है
    यूक्रेनी बच्चों के अपहरण के मामलों को ट्रैक करने वाला सरकारी प्रोग्राम फंडिंग की कमी से बंद हो गया, इस NPR लेख को देखकर लगता है कि क्या उन्हें ज़्यादा महत्वपूर्ण कामों पर ध्यान नहीं देना चाहिए?

    • राष्ट्रपति के pardon power के दुरुपयोग से FBI के लोग भी परेशान होते होंगे। वे पूरी जाँच करते हैं और फिर उसे राजनीतिक रूप से पलट दिया जाता है
    • मैं भी copyright उल्लंघन के लिए FBI की जाँच का निशाना बन चुका हूँ। उन्हें लगा था कि मैंने लाखों डॉलर कमाए हैं। इसमें राजनीतिक मंशा बहुत गहरी है
    • अमेरिकी jurisdiction समस्या है? ऐसी चीज़ों ने अमेरिका को पहले कभी नहीं रोका
    • क्या ऐसे मामलों को Interpol या UN को नहीं संभालना चाहिए? अमेरिका विदेशी बच्चों को क्यों ट्रैक कर रहा है, यह सवाल है
    • अमेरिकी सरकार को copyright से खुद कोई मतलब नहीं है। वह सिर्फ़ तब हरकत में आती है जब बड़ी कंपनियाँ असहज हों
  • मैं भी FBI की copyright जाँच का लक्ष्य रहा हूँ और सचमुच जेल भी गया हूँ
    मेरा मानना है कि ऐसे मामलों को आपराधिक नहीं बल्कि सिविल मुक़दमे के रूप में देखा जाना चाहिए
    FBI की जाँच प्राथमिकताएँ ज़्यादातर राजनीतिक होती हैं। धोखाधड़ी या साफ़-साफ़ अपराध न हो तो उन्हें दिलचस्पी नहीं होती
    मैंने अपना अनुभव निजी साइट पर लिखा है

  • व्हाइट हाउस भी archive.ph का उपयोग करता है
    “Retail sales are booming — up 5% over last year” यह वाक्य सीधे archive.ph से लिंक होता है
    संबंधित लेख लिंक

    • व्हाइट हाउस Reuters का ट्रैफ़िक छीनने जैसा petty काम क्यों कर रहा है? /s
  • लगता है FBI यह संदेश देना चाहती है कि “पूरा इंटरनेट scrape करना सिर्फ़ अमेरिका की बहुत बड़ी कंपनियों के लिए ठीक है”
    वे डेटा पर एकाधिकार करती हैं, उससे AI models को train करती हैं, और फिर उसे पैसे लेकर बेचती हैं

    • शायद archive बस खुद को AI startup के रूप में rebrand कर ले और कहे कि यह “scientifically scientific LLM” है। “copyright infringement? नहीं, यह scientific science है™”
  • मैं कई news sites की subscription देता हूँ, लेकिन फिर भी archive.is पर पढ़ता हूँ
    न login error, न subscription popup, बस एक साफ़ static webpage जैसा अनुभव

    • मेरा अनुमान है कि archive.is के पास बड़े media outlets के paid accounts हैं, या फिर botnet के ज़रिए logged-in HTML को modify करता है। संबंधित तकनीक के लिए html-private-set-intersection देखें
    • पहले मैं Lynx से भी ऐसे पढ़ लेता था, लेकिन अब साइटें सब टूट जाती हैं
    • मैं भी अक्सर HN links से देखता हूँ, और archive.is को donate भी कर चुका हूँ। यह गायब नहीं होना चाहिए
    • uBlock के annoyance filters से भी इसका समाधान हो सकता है
    • newsletter popups जितनी परेशान करने वाली चीज़ कोई नहीं। email अब fax-स्तर की पुरानी तकनीक बन चुका है
  • जब भी दुनिया को थोड़ा आसान बनाने वाली कोई सरल सेवा आती है, कोई न कोई उसे बर्बाद करने पर तुल जाता है
    जैसे फ़्रांस का लोकप्रियता कर, या Google की app verification को मजबूरी बनाने वाली policy

    • यूरोप के कुछ देशों में Anna’s Archive DNS blocking भी हो रही है
  • archive.is/XdQRp लिंक से देखा तो लेख पूरा मिलाकर बस कुछ पैराग्राफ़ का था
    मूल पेज पर विज्ञापन इतने ज़्यादा थे कि मैं दूसरे विज्ञापन तक पहुँचते-पहुँचते छोड़ चुका था। विज्ञापनों की अति पढ़ने के अनुभव को बर्बाद कर देती है

    • मैं भी privacy consent popups से बचने के लिए archive.is का उपयोग करता हूँ
    • chef’s kiss
    • यह संयोग जैसा लगता है
  • FBI के subpoena में बच्चों के यौन शोषण या राष्ट्रपति सुरक्षा से जुड़े ख़तरों जैसी विशिष्ट अपराध जाँच धाराओं का हवाला दिया गया है
    संबंधित एजेंटों में से एक पहले child exploitation cases पर काम कर चुका है
    संबंधित दस्तावेज़ लिंक

    • यह एक दिलचस्प परिदृश्य है। कोई व्यक्ति CSAM को थोड़ी देर के लिए अपलोड करे, फिर उसे archive में सेव कर दे और लिंक फैला दे — इस तरह दुरुपयोग संभव है
  • मुझे कल पता चला कि Verizon home internet archive.is को block करता है
    router DNS को openDNS में बदलने पर समस्या हल हो गई। यानी यह बस औपचारिक blocking भर है