ArchiveTeam ने सभी goo.gl short links के archive का काम पूरा किया
(tracker.archiveteam.org)- ArchiveTeam ने सभी goo.gl short links को सफलतापूर्वक archive कर लिया है
- ArchiveTeam Warrior नामक virtual archiving program के ज़रिए कोई भी archive project में भाग ले सकता है
- यह Warrior Windows, OS X, Linux वातावरण में बिना किसी अलग जोखिम के चलाया जा सकता है
- उपयोगकर्ता सरल settings के ज़रिए project चुनकर गतिविधियों में भाग ले सकते हैं
- यह आसान और सहज तरीका देता है, जिससे बिना किसी विशेष तकनीकी कौशल के भी archive गतिविधियों में मदद की जा सकती है
ArchiveTeam Warrior का परिचय
- ArchiveTeam Warrior एक virtual archiving appliance है जिसे कोई भी आसानी से इस्तेमाल कर सकता है
- उपयोगकर्ता Warrior चलाकर वेबसाइट आदि डाउनलोड कर सकते हैं और उन्हें ArchiveTeam के archive में upload करने के काम में भाग ले सकते हैं
- Warrior असली कंप्यूटर वातावरण को कोई जोखिम नहीं देता और सिर्फ internet bandwidth और थोड़ी disk space का उपयोग करता है
- यह Windows, OS X, Linux सभी वातावरणों को support करता है, और VirtualBox, VMware जैसे virtual machine program की आवश्यकता होती है
VirtualBox का उपयोग करने का तरीका
- Warrior appliance (357MB) डाउनलोड करें
- VirtualBox में File > Import Appliance मेनू पर क्लिक करके डाउनलोड की गई फ़ाइल लाएँ
- virtual machine शुरू करने पर यह अपने-आप नवीनतम updates लेता है और web browser इस्तेमाल करने का अनुरोध करता है
Warrior चलाने के बाद की प्रक्रिया
- Settings page पर जाकर उसे देखें
- leaderboard पर प्रगति दिखाने के लिए username चुनें
- All projects tab में अपनी पसंद का project चुनकर भाग लें, या सबसे ज़्यादा urgent project में शामिल होने के लिए ArchiveTeam’s Choice भी चुन सकते हैं
भाग लेने के फायदे
- बिना किसी विशेष तकनीकी कौशल या जटिल प्रक्रिया के कोई भी आसानी से archive project गतिविधियों में योगदान दे सकता है
- उपयोगकर्ता की archive गतिविधि उपलब्धियाँ leaderboard पर दिखाई जाती हैं, जिससे प्रेरणा और collaboration दोनों को बढ़ावा मिलता है
1 टिप्पणियां
Hacker News टिप्पणियाँ
जब भी ArchiveTeam ऐसा कोई प्रोजेक्ट करता है, मैं सचमुच हैरान रह जाता हूँ। कुछ साल पहले जिस video platform में मैं काम करता था, उसने जल्द ही सेवा बंद करने की घोषणा की थी। तब मेरा संपर्क ArchiveTeam के एक सदस्य से हुआ, और पता चला कि उन्हें data preserve करने के काम में रुचि है। मैंने उन्हें थोड़ी सलाह दी (server endpoints की जानकारी, जहाँ archiving में दिक्कत आ सकती थी), और अपने कुछ EC2 instances अस्थायी रूप से उधार भी दिए। Server मेरे स्वामित्व में थे, इसलिए मैं देख सकता था कि क्या हो रहा है। सिर्फ 2 मिनट में instances पूरी तरह तैयार हो गए और तेजी से videos archive करने लगे, और हर instance बिना duplication के अलग-अलग videos बहुत कुशलता से download कर रहा था। ArchiveTeam का मिशन तो हमेशा अच्छा लगता है, लेकिन उनका execution जिस efficiency से होता है, वह सचमुच प्रभावशाली है।
शीर्षक सही नहीं है। असल में यह Archiveteam.org है, Archive.org नहीं। The Internet Archive storage उपलब्ध कराता है, लेकिन वास्तविक archiving का काम Archiveteam के सदस्य करते हैं।
इससे जुड़ी सामग्री साझा करना चाहता हूँ: "लिंक रॉट (Link Rot) के खिलाफ युद्ध में शामिल हों" (लिंक), Google की goo.gl policy changes पर कई HN discussion threads (2018~2025 संबंधित पोस्ट संग्रह, यहाँ, यहाँ, यहाँ, यहाँ, यहाँ, यहाँ)। इस पर कई तरह की चर्चाएँ हैं, उम्मीद है मददगार होंगी।
Google का नवीनतम update साझा कर रहा हूँ: Google ब्लॉग update लिंक
क्या कोई reddit या twitter को पूरा archive कर रहा है? भले ही उनके Terms बदल गए हों और अब यह अनुमति न देते हों, फिर भी जिज्ञासा है।
यह page मुझे ठीक से समझ नहीं आ रहा। वहाँ dataset list (शायद?) दी हुई है, और उसका size 91 TiB तक काफी बड़ा दिख रहा है। सिर्फ Google shortened links और target URLs की सूची के लिए 91 TiB की ज़रूरत पड़े, ऐसा नहीं लगता। क्या किसी को इसका सिद्धांत पता है?
मुझे खुशी है कि मैं इस archiving में थोड़ा-बहुत योगदान दे पाया।
सोच रहा हूँ कि कितने links private YouTube videos या Google Docs जैसी चीज़ों की ओर जाते होंगे।
मैं यह जानना चाहता हूँ कि "all" का मतलब वास्तव में सभी publicly available URLs है, या फिर पूरे URL namespace को brute-force की तरह बार-बार आज़माया गया है।