2 पॉइंट द्वारा GN⁺ 2023-12-05 | 1 टिप्पणियां | WhatsApp पर शेयर करें

अपराध विश्लेषण और अपराध पूर्वानुमान में error range की आवश्यकता

  • यह ज़ोर दिया गया है कि अपराध पूर्वानुमान में error range शामिल होनी चाहिए
  • Richard Rosenfeld ने हाल ही में criminologists के लिए लिखे एक लेख में राष्ट्रीय अपराध दर के पूर्वानुमान पर चर्चा की
  • FBI के अपराध आँकड़े एक साल देर से जारी करने पर शिकायतें हैं, लेकिन अकादमिक जगत इससे भी देर से "पूर्वानुमान" देता है

ARIMA मॉडल का उपयोग करके विश्लेषण

  • Python में ARIMA मॉडल का उपयोग करके यह विश्लेषण किया गया कि एक उचित forecast error कैसा दिखता है
  • डेटा और कोड GitHub पर उपलब्ध हैं
  • डेटा लोड करने और libraries import करने का संक्षिप्त विवरण, साथ ही डेटा format को सही तरह सेट करने की प्रक्रिया समझाई गई है

मॉडल fitting की तैयारी

  • Richard के पेपर जैसी शर्तों के साथ ARIMA(1,1,2) मॉडल fitting
  • Richard के मॉडल की व्याख्या और तुलना, तथा मॉडल के output results दिए गए हैं

पूर्वानुमान और error range

  • statsmodels package का उपयोग करके नया डेटा जोड़ा गया और one-step-ahead forecast किया गया
  • ऐसे forecast results दिए गए हैं जो दिखाते हैं कि पूर्वानुमान की standard error समय के साथ बढ़ती जाती है

Richard के अनुमान से तुलना

  • Richard के forecast values से तुलना करके हर मॉडल का MAPE (Mean Absolute Percentage Error) निकाला गया
  • prediction intervals दिखाते हुए यह रेखांकित किया गया है कि observed values अब भी अनुमानित मॉडल के अनुरूप हैं

अंतिम बिंदु

  • यह तर्क दिया गया है कि Richard मैक्रो-स्तर के अपराध पूर्वानुमान में बार-बार बड़ी गलती करें, तब भी इससे बहुत फर्क नहीं पड़ता
  • यह दावा किया गया है कि राष्ट्रीय स्तर के अपराध पूर्वानुमान नीति-प्रतिक्रिया में मददगार नहीं होते
  • वास्तविक अपराध पूर्वानुमान के उपयोग के उदाहरण के रूप में, शहर के बढ़ने के साथ पुलिस बल बढ़ाने की ज़रूरत का अनुमान लगाने का तरीका प्रस्तुत किया गया है

GN⁺ की राय

इस लेख का सबसे महत्वपूर्ण बिंदु यह है कि अपराध पूर्वानुमान में error range के महत्व और पूर्वानुमान की अनिश्चितता को स्वीकार करने की आवश्यकता पर ज़ोर दिया गया है। भले ही अपराध पूर्वानुमान नीति-निर्णय में सीधे उपयोगी न हो, फिर भी forecast modeling अपराधविज्ञान के सिद्धांतों की वैधता परखने का एक महत्वपूर्ण उपकरण हो सकती है। यह लेख data science और अपराधविज्ञान के संगम पर काम करने वाले लोगों को रोचक insight देता है, और forecast models की सीमाओं तथा उन्हें दूर करने के तरीकों पर गहन चर्चा प्रस्तुत करता है.

1 टिप्पणियां

 
GN⁺ 2023-12-05
Hacker News राय
  • पूर्वानुमान और निर्णय-निर्माण के बीच संबंध

    • आम तौर पर पूर्वानुमान का परिणाम निर्णय-निर्माण में होना चाहिए.
    • जब पूर्वानुमान निर्णय-निर्माण से अलग हो जाता है, तो उसका मूल्य अस्पष्ट हो जाता है.
    • रोसेनफेल्ड अतीत के डेटा पर सांख्यिकीय निष्कर्षों को अधिक वज़न देने के लिए पूर्वानुमान का उपयोग करना चाहते हैं, लेकिन यह संदिग्ध है.
  • error bars का अर्थ

    • error bars का अर्थ स्पष्ट नहीं है.
    • एक है confidence interval (मॉडल 95% संभावना देता है कि output इस range के भीतर होगा).
    • दूसरा है standard deviation (अपने पूर्वानुमान और परिणाम के बीच squared difference का पूर्वानुमान करना).
  • error bars का महत्व

    • नई treatment के फ़ायदे की तुलना करते समय error bars बेहतर समझ देते हैं.
    • कुछ लोगों को लगता है कि इससे समस्या और उलझ जाती है.
    • कुछ मामलों में अर्थपूर्ण error bars प्राप्त करना बहुत कठिन होता है.
  • सांख्यिकीय distribution की समीक्षा

    • महत्वपूर्ण metrics के histogram (सांख्यिकीय distribution) को नियमित रूप से देखते हैं.
    • web service call की गति की समस्या में दो स्पष्ट peaks दिखाई दिए.
    • logged-out users और logged-in users को दर्शाने वाले इन दो peaks के ज़रिए समस्या के कारण को अधिक गहराई से समझा गया.
  • तारीख़ के अनुमान पर error bars

    • तारीख़ के अनुमान (यानी deadline) में भी error bars होने चाहिए.
    • तारीख़ें भी पूर्वानुमान हैं, और uncertainty estimate के बिना उनका कोई अर्थ नहीं है.
  • uncertainty quantification का महत्व

    • data science, और ख़ासकर machine learning में, uncertainty quantification को अक्सर नज़रअंदाज़ किया जाता है.
    • practitioners के पास हमेशा सांख्यिकीय पृष्ठभूमि नहीं होती.
  • पूर्वानुमान और measurement की तुलना

    • पूर्वानुमान को भविष्य के measurement के रूप में देखा जा सकता है.
    • uncertainty की जानकारी के बिना किया गया कोई भी measurement अर्थहीन है.
  • मौसम को लेकर गलतफ़हमी

    • शुरुआत में लगा कि यह लेख मौसम के बारे में है.
  • वर्तमान या अतीत का पूर्वानुमान, यानी nowcasting

    • डेटा का इंतज़ार करते हुए वर्तमान या अतीत का पूर्वानुमान लगाने की कला.
    • error range के बिना यह गलत science/statistics है.
  • error bars के बिना भी उपयोगी पूर्वानुमान

    • कभी-कभी केवल simple point prediction ही कार्रवाई का मार्गदर्शन करने के लिए काफ़ी होता है.
    • पूर्वानुमान distribution की पूरी जानकारी बेहतर निर्णय लेने में मदद कर सकती है.
  • Gaussian process regression के फ़ायदे

    • Gaussian process regression (या kriging) का एक बड़ा फ़ायदा है.
  • सभी estimate/prediction/forecast/interpolation/extrapolation के लिए confidence/prediction/tolerance interval की आवश्यकता

    • confidence/prediction/tolerance interval होना चाहिए, जिसमें वे assumptions भी शामिल हों जो टीम इस समस्या पर लगा रही है.