1 पॉइंट द्वारा GN⁺ 2023-12-23 | 1 टिप्पणियां | WhatsApp पर शेयर करें

इस अनुरोध की सामग्री का सारांश नहीं दिया जा सकता। उपलब्ध लेख की सामग्री 403 Forbiddennginx त्रुटि संदेश है, जो वास्तविक लेख की सामग्री नहीं बल्कि यह दर्शाने वाला HTTP status code है कि पहुंच की अनुमति नहीं है। यह आमतौर पर तब होने वाली त्रुटि है जब web server अनुरोध को समझ लेता है, लेकिन उसे पूरा करने की अनुमति नहीं होती।

GN⁺ की राय

  • 403 Forbidden त्रुटि web developer या system administrator के लिए एक परिचित समस्या है, जो permission settings या server configuration error के कारण हो सकती है।
  • यह त्रुटि संदेश बताता है कि जब उपयोगकर्ता वेबसाइट के किसी विशेष हिस्से तक पहुंचने की कोशिश करता है, तो server उस पहुंच को अस्वीकार कर देता है।
  • ऐसी त्रुटियां web security से गहराई से जुड़ी होती हैं और यह एक महत्वपूर्ण सुविधा है जो उपयोगकर्ता को उचित अनुमति के बिना sensitive information तक पहुंचने से रोकती है।

1 टिप्पणियां

 
GN⁺ 2023-12-23
Hacker News की राय
    • यह sampling करने का बहुत ही चतुर तरीका है, और मैं लेखकों की सराहना करता हूँ। जब मैं Pew में काम करता था, तब मैंने YouTube को API के "related videos" endpoint के जरिए random walk से मैप करने की कोशिश की थी, लेकिन एक साल बाद ऐसा लगा कि हम saturation पर पहुँच गए हैं। लेकिन यहाँ वर्णित आकार यह संकेत देता है कि radar के नीचे उड़ने वाली एक लंबी tail मौजूद है। हमारे अध्ययन के प्रकाशित होने के तुरंत बाद Google ने लगभग फ़ौरन API को लॉक करना शुरू कर दिया था, लेकिन यह देखकर खुशी होती है कि लोग अब भी पुराने scraping तरीकों से शोध जारी रखे हुए हैं। हमारा analysis channel स्तर पर था और केवल लोकप्रिय channels पर केंद्रित था, लेकिन यह दिलचस्प है कि TubeStats के कुछ आँकड़े हमारे निष्कर्षों के काफ़ी क़रीब हैं (जैसे भाषा वितरण)।*
    • चतुर sampling विधि की प्रशंसा, और Pew में किए गए समान शोध अनुभव को साझा करना
    • Google द्वारा API access सीमित किए जाने के बावजूद scraping-आधारित शोध जारी रहने पर सकारात्मक प्रतिक्रिया
    • अपने शोध और TubeStats के डेटा के बीच समानताओं का उल्लेख
    • यह German tank problem पर mitigation attack method के रूप में दिलचस्प है। आदर्श समाधान शायद address space को इतना बढ़ाना होगा कि random samples सांख्यिकीय रूप से सार्थक निष्कर्ष तक पहुँचने के लिए आवश्यक डेटा इकट्ठा न कर सकें। और भी अच्छे समाधान हो सकते हैं, लेकिन वास्तव में random samples ऐसे प्रयासों को सीमित कर देंगे।*
    • German tank problem का संदर्भ देते हुए डेटा संग्रह को रोकने के लिए address space बढ़ाने का सुझाव
    • मैं "YouTube dislike" dataset देखने की सिफारिश करता हूँ। यह dataset dislike फीचर हटाए जाने से पहले जानकारी इकट्ठा करने के archival प्रयास के रूप में बनाया गया था। इसका उपयोग करके सबसे विवादास्पद videos, किसी विशेष भाषा में वर्णित शीर्ष videos आदि खोजे जा सकते हैं।*
    • YouTube dislike dataset का उपयोग कर संभावित analysis के बारे में जानकारी
    • मैंने यह पता लगाने की कोशिश की कि YouTube के पास कुल कितना data है, लेकिन उसका कोई सटीक आँकड़ा नहीं मिला। मैंने औसत video length 500 seconds और bitrate 400 KB/s मानकर, 1.3 billion videos के आधार पर 2.7 exabytes का हिसाब लगाया। यह storage के लिए आवश्यक मात्रा से कम का अनुमान है, क्योंकि YouTube लोकप्रिय videos को कई datacenters में रखता है, और उन्हें VP9 तथा AV1 formats में भी स्टोर करता है। संभव है कि YouTube कम लोकप्रिय videos को compress करता हो या किसी दूसरे format से on-demand transcode करता हो, लेकिन मुझे नहीं लगता कि ऐसा होने से यह अनुमान बहुत बदलता है।*
    • YouTube डेटा की मात्रा का अनुमान और storage पद्धति पर अटकल
    • Google कुछ positions के लिए YouTube की scaling समस्या के बारे में पूछा करता था। बात अक्सर बढ़ती हुई distributed infrastructure में log data को synchronize करने की Big-O complexity पर पहुँच जाती थी। नतीजा एक लगभग अवर्णनीय रूप से जटिल Big-O(f(n)) function होता था। मज़ेदार था।*
    • Google interview अनुभव के आधार पर YouTube scalability समस्या का उल्लेख
    • इस लेख का परिणाम यह companion website है: TubeStats.org*
    • लेख से संबंधित वेबसाइट का लिंक
    • बहुत बड़ा। कल रात मुझे अपने फ़ोन पर YouTube app अपडेट करने की सूचना मिली। समस्या यह है कि वही मेरे फ़ोन पर चलने वाला आख़िरी version है। कम-से-कम web अभी भी काम करता है।*
    • YouTube app के आकार और update समस्या पर व्यक्तिगत अनुभव
    • यह dataset दिलचस्प है। paper channel statistics के बारे में थोड़ा भ्रामक प्रभाव देता है: यदि sampling bias को ठीक करके subscriber count को फिर से calibrate नहीं किया जाता, तो किसी दिए गए channel के दिखाई देने की संभावना उस channel के public videos की संख्या के अनुपात में होती है, इसलिए प्रति channel videos की संख्या के लिए लगभग ~1/# के हिसाब से weight देना चाहिए।*
    • channel statistics के बारे में dataset से पैदा हो सकने वाली गलतफ़हमी और sampling method की व्याख्या
    • क्या sampling function यह मानता है कि सभी "area codes" में उपलब्ध numbers की संख्या समान है? कुछ बड़े sites (जैसे Twitter आदि) के मामले में, ज़्यादा अनुरोधित data रखने वाले shards काफ़ी कम dense हो सकते हैं। उदाहरण के लिए, Justin Bieber वाले area code में कम numbers होंगे। यह काफ़ी विकृत करने वाला हो सकता है।*
    • sampling method पर सवाल और विशेष data shards की density के अंतर का परिणामों पर प्रभाव
    • यह मैंने देखी हुई सबसे बेहतरीन चीज़ों में से एक है। Redditmap.social*
    • किसी विशेष वेबसाइट के प्रति प्रशंसा