잔차의 정규성

    [기계학습]회귀분석의 진단 ( nomal Q-Q plot ,Residual vs Fitted, Residuals 산점도 )

    Machine Learning 기계학습 머신러닝 회귀분석의 진단 적절한 변수를 통해 어느 정도 성능지표가 잘 나오는 모델을 만들었다. 과연 이 회귀모델이 잘 만들어진 모델인 것인가에 대한 진단이 필요. 회귀분석에서는 아래 잔차에 대한 세 가지 가정이 존재 : 정규성, 독립성, 등분산성 세 가지 가정을 만족할 시 잘 만들어진 회귀모델이라 판단. 회귀분석의 가정: X와 Y는 선형 관계다. 선형성 - 독립변수의 변화에 따라 종속 번수도 변화하는 선형인 모형이다. 독립성 - 잔차와 독립변수의 값이 관련되어 있지 않다. ( 더빈-왓슨 통계량 이용) 등분산성 - 오 차 항들의 분포는 동일한 분산을 갖는다. 비상관성 - 잔차들끼리 상관이 없어야 한다. 정상성 - 잔차항이 정규분포를 이뤄야 한다. 잔차의 정규성 검정 ..