कुछ दिन पहले anti-crawler सुरक्षा सेटिंग को ढीला किया था, लगता है उसी से सर्वर पर ज़्यादा लोड आ गया
असल में यह कदम सामान्य users को block होने से बचाने के लिए था, लेकिन शायद इसे बहुत ज़्यादा ढीला कर दिया गया
सुबह 5:24 पर PagerDuty alert मिला और HN देखा तो सब ठीक लग रहा था, इसलिए मैंने उसे resolved mark कर दिया, लेकिन सच यह है कि उस वक्त मैं बस सो रहा था
लगता है दोपहर तक और पता चल पाएगा
मज़ेदार है, अब यह आधिकारिक रूप से साबित हो गया कि Dang नींद में भी HN manage करता है
ज़्यादा चिंता मत कीजिए। आखिर यह सिर्फ articles पढ़ने और comments करने की साइट है
नींद पूरी लेनी चाहिए। कुछ घंटे डाउन रहे तो भी ठीक है। हमेशा शुक्रिया
जब HN पहली बार नहीं खुला तो मुझे लगा शायद कोई global outage हुआ है downforeveryoneorjustme.com/hacker-news पर देखा तो थोड़े ही समय में 52 reports थीं
सोच रहा हूँ इतना crawl किसने किया होगा। DDoS था, या AI कंपनी का data collection
HN का API भी है और dataset भी, फिर भी crawl करने की वजह दिलचस्प है
अमेरिका के हिसाब से सोने के समय alerts अस्थायी रूप से बंद रखने की ops policy भी ठीक हो सकती है
HN महत्वपूर्ण है, लेकिन इतना high-risk नहीं कि भोर में उठकर respond करना पड़े
नींद की कमी की cost काफ़ी बड़ी होती है, यह मैंने अनुभव से सीखा है
माफ़ी माँगने की ज़रूरत नहीं। हम सबको टालते आ रहे काम थोड़ी देर रोकने का मौका मिल गया
HN डाउन होते ही मैं infinite loop में फँस गया
“HN डाउन है → HN पर जाकर डाउन होने की खबर देखनी चाहिए → HN डाउन है” यही चलता रहा
मेरे साथ भी यही हुआ। “थोड़ी देर में वापस आ जाएगा” सोचकर refresh करता रहा और कई घंटे निकल गए
अच्छा है कि अब वह loop टूट गया
मुझे अनजाने में browser फिर से खोलकर HN front page दो-तीन बार चेक करने की आदत है
मज़ेदार बात यह है कि मैं डाउन न होने पर भी HN loop में फँस जाता हूँ
सुबह उठकर लगा, “क्या मैं नरक में जागा हूँ?”
मुझे लगा कोई बहुत बड़ा incident हुआ है, इसलिए Linux Discord server में पूछ लिया: “HN डाउन है, क्या कोई बड़ी outage है?”
आज नया पता चला कि मेरे हाथों में अपने-आप Hacker News खोलने वाला reflex है
यहाँ comments पढ़कर ही मुझे सबसे ज़्यादा सीखने को मिलता है। शायद इसी वजह से यह लत लगी है
अच्छा लगा कि सिर्फ मैं ही ऐसा नहीं हूँ। browser address bar में सिर्फ ‘n’ टाइप करूँ तो autocomplete में HN आ जाता है
मैं LeechBlock इस्तेमाल करता हूँ और नया HN tab खोलने पर 5-second delay timer लगाया हुआ है
अगर focus हट जाए तो timer fail हो जाता है, इसलिए यह सच में गति धीमी करने में मदद करता है LeechBlock लिंक
मैं उस stage से आगे बढ़ गया, 4 apps बना चुका हूँ, और अब ARR 500 million dollar के करीब है
मैंने no procrast mode चालू करके HN को हर घंटे सिर्फ 10 मिनट देखने की setting की थी, और यह काफ़ी असरदार रही
सुबह की routine में HN न होने से कुछ अधूरा-सा लगा
इसका असर AWS या Cloudflare outage से भी मेरे दिन पर ज़्यादा पड़ा
सोच रहा था कि HNStatus Twitter account अभी भी valid है या नहीं
login किए बिना सिर्फ non-chronological feed दिखती है, इसलिए इसकी उपयोगिता लगभग नहीं के बराबर है
पूछा गया कि status check करने का कोई बेहतर तरीका है क्या
हम वहाँ तभी post करते हैं जब हमें outage का पता हो और उसे कुछ मिनट से ज़्यादा समय लगे
इस बार हमें पता ही नहीं था। संबंधित बात इस comment में है
xcancel.com/HNStatus pinned tweet के बाद सिर्फ sequential ordering बनाए रखता है
x.com link को xcancel.com में बदल दें तो काफ़ी साफ़ दिखता है
mobile app में “Following” tab की sorting को “most recent” कर दें तो फिर से chronological feed मिलती है
यह setting web पर भी बनी रहती है
hn.hund.io भी एक status page है, लेकिन इस बार यह detect नहीं कर पाया
एक समस्या यह भी है कि text का रंग gray है, इसलिए पढ़ने का मन नहीं करता
“साल खत्म होने से पहले error budget खर्च करना है” वाला मज़ाक मज़ेदार था
साल के अंत में ‘न इस्तेमाल करो तो खत्म हो जाएगा’ वाले budget की वजह से, पहले reject हुई requests को जल्दबाज़ी में process करने की बात याद आ गई
नतीजतन, वह budget आधे साल तक ठीक से इस्तेमाल ही नहीं हो पाया था
दिलचस्प बात यह है कि login न किए हुए state में साइट खुलती रही
डाउन रहने पर मेरे मन में आया, “लगता है आज का दिन productive रहेगा”
अगली बार private browsing mode में खोल लेना
HN की ज़्यादातर outages सिर्फ logged-in requests को affect करती हैं
cookies delete भी कर सकते हैं, लेकिन recovery के बाद फिर login करना पड़ेगा
हाहाहा
web नहीं खुल रहा था, लेकिन मेरा HN CLI tool read-only mode में access कर पा रहा था hnterminal लिंक
इस बार कई outage detection services ठीक से काम नहीं कर पाईं
लगा कि एक reliability dashboard होना चाहिए
शायद caching की वजह से भ्रम हुआ। logged-out page पर strong cache थी, इसलिए वह normal response जैसा दिख रहा था
तो अब outage detector के outage detector की भी ज़रूरत पड़ेगी
आखिरकार, बात downdetectorsdowndetector.com जैसी किसी चीज़ तक पहुँचती है
1 टिप्पणियां
Hacker News की राय
कुछ दिन पहले anti-crawler सुरक्षा सेटिंग को ढीला किया था, लगता है उसी से सर्वर पर ज़्यादा लोड आ गया
असल में यह कदम सामान्य users को block होने से बचाने के लिए था, लेकिन शायद इसे बहुत ज़्यादा ढीला कर दिया गया
सुबह 5:24 पर PagerDuty alert मिला और HN देखा तो सब ठीक लग रहा था, इसलिए मैंने उसे resolved mark कर दिया, लेकिन सच यह है कि उस वक्त मैं बस सो रहा था
लगता है दोपहर तक और पता चल पाएगा
नींद पूरी लेनी चाहिए। कुछ घंटे डाउन रहे तो भी ठीक है। हमेशा शुक्रिया
downforeveryoneorjustme.com/hacker-news पर देखा तो थोड़े ही समय में 52 reports थीं
सोच रहा हूँ इतना crawl किसने किया होगा। DDoS था, या AI कंपनी का data collection
HN का API भी है और dataset भी, फिर भी crawl करने की वजह दिलचस्प है
HN महत्वपूर्ण है, लेकिन इतना high-risk नहीं कि भोर में उठकर respond करना पड़े
नींद की कमी की cost काफ़ी बड़ी होती है, यह मैंने अनुभव से सीखा है
HN डाउन होते ही मैं infinite loop में फँस गया
“HN डाउन है → HN पर जाकर डाउन होने की खबर देखनी चाहिए → HN डाउन है” यही चलता रहा
अच्छा है कि अब वह loop टूट गया
आज नया पता चला कि मेरे हाथों में अपने-आप Hacker News खोलने वाला reflex है
अगर focus हट जाए तो timer fail हो जाता है, इसलिए यह सच में गति धीमी करने में मदद करता है
LeechBlock लिंक
सुबह की routine में HN न होने से कुछ अधूरा-सा लगा
सोच रहा था कि HNStatus Twitter account अभी भी valid है या नहीं
login किए बिना सिर्फ non-chronological feed दिखती है, इसलिए इसकी उपयोगिता लगभग नहीं के बराबर है
पूछा गया कि status check करने का कोई बेहतर तरीका है क्या
इस बार हमें पता ही नहीं था। संबंधित बात इस comment में है
x.com link को xcancel.com में बदल दें तो काफ़ी साफ़ दिखता है
यह setting web पर भी बनी रहती है
एक समस्या यह भी है कि text का रंग gray है, इसलिए पढ़ने का मन नहीं करता
“साल खत्म होने से पहले error budget खर्च करना है” वाला मज़ाक मज़ेदार था
नतीजतन, वह budget आधे साल तक ठीक से इस्तेमाल ही नहीं हो पाया था
लगता है साइट करीब 3 घंटे तक डाउन रही
incident लिंक,
downforeveryoneorjustme.com/hacker-news देखें
अजीब बात यह रही कि statuspal में इसका कोई record नहीं था
statuspal लिंक
डाउन रहने पर मेरे मन में आया, “लगता है आज का दिन productive रहेगा”
HN की ज़्यादातर outages सिर्फ logged-in requests को affect करती हैं
cookies delete भी कर सकते हैं, लेकिन recovery के बाद फिर login करना पड़ेगा
web नहीं खुल रहा था, लेकिन मेरा HN CLI tool read-only mode में access कर पा रहा था
hnterminal लिंक
इस बार कई outage detection services ठीक से काम नहीं कर पाईं
लगा कि एक reliability dashboard होना चाहिए