1 पॉइंट द्वारा GN⁺ 2024-08-01 | 1 टिप्पणियां | WhatsApp पर शेयर करें

Linear Regression की सच्चाई

  • परिचय

    • यह दस्तावेज़ 2015 की शरद ऋतु में 36-401, Modern Regression पढ़ाते समय लिखे गए लेक्चर नोट्स पर आधारित है
    • यह Linear Regression सीखने या सिखाने वालों के लिए उपयोगी हो सकता है
    • इसमें पारंपरिक सिद्धांत में Gaussian noise और बिल्कुल सही तरह से निर्दिष्ट linear model पर निर्भरता को कम किया गया है, और अधिक computation-intensive लेकिन robust तकनीकों पर ज़ोर दिया गया है
  • पूरा PDF टेक्स्ट

    • data files
    • प्रत्येक अध्याय का R code
    • वर्तमान outline
  • सर्वोत्तम prediction

    • statistical modeling का परिचय
    • simple linear regression model और estimation के लिए संकेत
  • simple linear regression के लिए least squares

    • simple linear regression के लिए maximum likelihood
    • simple regression diagnosis और correction
    • parameters पर inference
    • simple linear model के लिए predictive inference
    • transformation के बाद parameter interpretation
    • F-test, R^2 और अन्य सावधानियां
    • matrix form में simple linear regression
  • multiple linear regression

    • multiple linear regression diagnosis और inference
    • polynomial और categorical regression
    • multicollinearity
    • tests और confidence intervals
    • interaction
    • outliers और influential points
    • model selection
    • review
    • weighted और generalized least squares
    • variable selection
    • trees
    • bootstrap I
    • bootstrap II

GN⁺ का सारांश

  • यह दस्तावेज़ Linear Regression के लिए एक आधुनिक दृष्टिकोण प्रस्तुत करता है, और पारंपरिक सैद्धांतिक सीमाओं को पार करने के लिए अधिक robust computational तरीकों पर ज़ोर देता है
  • इसमें statistical modeling और regression analysis को बुनियाद से लेकर उन्नत विषयों तक व्यापक रूप से शामिल किया गया है
  • खास तौर पर, multicollinearity, variable selection, bootstrap जैसे व्यावहारिक रूप से महत्वपूर्ण विषय शामिल हैं
  • यह दस्तावेज़ statistics और data science पढ़ने वाले छात्रों या practitioners के लिए उपयोगी हो सकता है
  • समान प्रकृति वाले दूसरे प्रोजेक्ट्स में "Advanced Data Analysis from an Elementary Point of View" शामिल है

1 टिप्पणियां

 
GN⁺ 2024-08-01
Hacker News राय
  • ज़्यादातर लोग linear regression को ठीक से नहीं समझते

    • सभी सामान्य statistical tests linear models होते हैं
    • linear models पैरामीटर्स के प्रति linear होते हैं, response के प्रति नहीं
    • अगर उपयुक्त spline basis चुना जाए, तो predictors और response के बीच कई nonlinear संबंधों को linear models से मॉडल किया जा सकता है
    • Taylor theorem के अनुसार, linear संबंध nonlinear संबंधों का अच्छा approximation हो सकते हैं
  • मैंने 10 साल पहले CMU में statistics की क्लास ली थी, और R सीखना अच्छा लगा था

    • linear regression की बड़ी कमजोरी यह है कि यह छोटे training datasets पर तो काम करती है, लेकिन real-world data पर लागू करना कठिन होता है
  • Ridge Regression multicollinearity की समस्या सुलझाने में उपयोगी है

    • आजकल इसे overfitting रोकने वाली regularization technique के रूप में पढ़ाया जाता है, लेकिन मूल रूप से इसका उपयोग बहुत अधिक correlated predictors के बीच weights को संतुलित करने के लिए होता था
  • मैं सीखना चाहता हूँ कि Citadel के quant researchers linear regression का इस्तेमाल कैसे करते हैं

    • मुझे जिज्ञासा है कि वे कौन-से theoretical results को महत्वपूर्ण मानते हैं
  • undergraduate कोर्स में मैंने linear regression कई बार पढ़ी है

    • statistics और probability theory के ज़रिए इसकी optimality साबित की जा सकती है
  • PhD में मैं मुख्य रूप से deep learning models का उपयोग करने वाली regression समस्याओं पर काम करता हूँ

    • अच्छा होगा अगर classical linear models के सख्त proofs और theorems को deep learning regression models पर लागू करने का कोई तरीका हो
  • Shalizi की "Data Analysis from an Elementary Point of View" एक अच्छी introductory किताब है

    • यह linear और additive models तथा simulation पर ज़ोर देती है
    • किताब का 90% कंप्यूटर के बिना बेकार है, लेकिन यही आधुनिक सच्चाई है
  • regression में सबसे महत्वपूर्ण कौशल intercept को पहचानना है

    • interaction terms शामिल हों, तो intercept का मतलब समझना महत्वपूर्ण हो जाता है
    • उदाहरण के लिए, उम्र और autism diagnosis variable वाले एक simple linear model में intercept क्या दर्शाता है, यह समझना चाहिए
  • XGBoost का उपयोग करके regression सिखाने वाले व्यक्ति के रूप में, यह लेख बहुत उपयोगी और आसानी से समझ आने वाला है

    • खासकर chapter 6, visual diagnostics बहुत अच्छी तरह लिखा गया है
  • इस लेख में इसका ज़िक्र नहीं है, लेकिन linear regression में भी deep learning में आम तौर पर दिखने वाला Double Descent phenomenon दिखाई देता है

    • इसके लिए regularization लानी पड़ती है
  • मुझे जिज्ञासा है कि क्या किसी को इस PDF को mobile-optimized रूप में बदलने का तरीका पता है