- web scraping की कानूनी जटिलताओं और पाखंड पर एक लेख
- Meta और Microsoft जैसी बड़ी कंपनियाँ अपने प्लेटफ़ॉर्म पर web scraping पर रोक लगाती हैं, जबकि साथ ही दूसरी कंपनियों के प्लेटफ़ॉर्म से डेटा इकट्ठा करती हैं
- इंटरनेट पर डेटा तक पहुँचने और उसका उपयोग करने से जुड़े कानूनी मुद्दों और उसके उद्देश्य की जटिलता। कुछ डेटा रूप copyright या अन्य intellectual property rights से सुरक्षित होते हैं, लेकिन इंटरनेट का अधिकांश डेटा आसानी से संरक्षित नहीं होता
- LinkedIn और Facebook जैसी social media कंपनियाँ web scraping से जुड़े मुकदमों को सबसे आक्रामक तरीके से आगे बढ़ाती हैं। लेकिन जिस कंटेंट को वे बचाना चाहती हैं, वह users द्वारा बनाया गया है, उनका अपना स्वामित्व नहीं
- इंटरनेट के शुरुआती दौर में कंपनियों ने web scraping को सामान पर अतिक्रमण जैसा मानकर रोकने के लिए कानूनी सिद्धांतों का इस्तेमाल किया। यानी, यह तर्क दिया गया कि अवांछित बड़ी मात्रा में data requests किसी व्यक्ति की मूर्त संपत्ति, अर्थात computer servers, पर अतिक्रमण का रूप हैं
- 2000 के शुरुआती दशक से 2017 तक, Computer Fraud and Abuse Act (CFAA) web scraping को रोकने का मुख्य कानूनी आधार था। CFAA "protected computers" पर unauthorized access को प्रतिबंधित करता है
- 2017 के hiQ Labs, Inc. v. LinkedIn Corp. मामले में web scrapers के सार्वजनिक LinkedIn डेटा तक CFAA के तहत पहुँच के अधिकार की पुष्टि हुई, जिसके बाद कई लोगों ने इसे public data scrape करने के सकारात्मक अधिकार के रूप में समझा
- वर्तमान में web scraping रोकने का प्रमुख तरीका contract breach के दावे हैं। इससे कंपनियाँ contract law के ज़रिए डेटा के उपयोग और पहुँच पर property rights जैसा दावा कर सकती हैं
- property law से contract law की ओर यह बदलाव website owners को online terms of service के माध्यम से online data पर अपने अधिकार परिभाषित करने देता है
- यह लेख Microsoft जैसी कंपनियों के पाखंड को उजागर करता है। हाल ही में उसने AI services के scraping पर रोक लगाने के लिए अपने terms of service अपडेट किए, लेकिन उसकी सहयोगी OpenAI ने ऐसा product जारी किया है जिसे पूरे इंटरनेट को scrape करने के लिए डिज़ाइन किया गया है
- लेखक इस बात की आलोचना करते हैं कि अदालतें निजी कंपनियों को adhesion contracts के माध्यम से intellectual property rights जैसा अधिकार बनाने दे रही हैं, और तर्क देते हैं कि ऐसे फ़ैसले सार्वजनिक हित का विषय होने चाहिए
- लेख का सुझाव है कि web scraping पर मौजूदा कानूनी ढाँचा generative AI के मामलों से परखा जाएगा, कानून की यह असंगति टिक नहीं पाएगी, और आने वाले वर्षों में महत्वपूर्ण कानूनी बदलाव होंगे
1 टिप्पणियां
Hacker News की राय