반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- box-cox변환
- spearman
- 시각화
- 베이지안론
- 데이터 시각화
- python error plot
- Pearson
- error bar plot
- marketing
- 백분위 변환
- marketing insight
- python
- data analysis
- ecommerce data
- 빈도주의론
- 데이터 분석
- ttest
- cltv
- FWER
- 고객가치분석
- lifetimevalue
- E-Commerce
- python significance level
- 다중검정
- plot
- 통계
- p value plot
- matplotlib
- 분위수 변환
- Yeo-Johnsom 변환
Archives
- Today
- Total
Data 공부
[통계] 정규성 검정(Normality Test) 본문
정규성 검정(Normality Test)
1. 정규성 검정(Normality Test)이란?
- 데이터 분석에서 정규성 검정을 하는 이유는 가설 검정과 회귀 분석 등의 통계적 모형에서 정규분포 가정이 필요하기 때문이다. 일반적으로, 대규모 표본의 경우 중심극한정리에 따라 정규분포를 따르기 때문에 정규성 검정을 할 필요가 없지만, 작은 표본의 경우 정규성이 중요한 역할을 한다. 정규성 검정을 통해 데이터가 정규분포를 따르는지 여부를 판단할 수 있으며, 필요한 경우 데이터를 변환하여 정규성을 높일 수 있다.
2. 정규성 검정 가설
- 귀무가설(H0): 데이터셋이 정규분포를 따른다.
- 대립가설(H1): 데이터셋이 정규분포를 따르지 않는다.
- p_value < 0.05일 경우 해당 데이터셋은 정규분포를 따르지 않음.
3. 정규성 검정 방식.
- normal test (scipy.stats)
- normal test는 왜도(skew)와 첨도(kurtosis)를 통해 정규성을 검정하게 된다. 검정하는 방식은 2-sided 카이제곱 검정으로 시행한다.
- shapiro test (scipy.stats)
- shapiro test는 정규성 검정 방법 중 하나이다. 이 방법은 특정 변수가 정규분포를 따르는지 여부를 판단하는데 사용된다. shapiro test는 표본의 크기가 작을 때도 유용하며, 많은 통계적 분석에서 중요한 선행 조건 중 하나이다
- 표본수가 2000 미만일 경우 주로 사용된다.
- KS test (scipy.stats)
- Kolmogorov-Smirnov(KS) 검정은 두 확률 분포가 같은 분포인지를 검정하는 검정 방법 중 하나입니다. 이 검정은 두 분포간의 최대 차이 값을 이용하여 검정을 수행한다. 일반적으로, KS 검정은 대부분의 분포에서 사용할 수 있으며, 특히 큰 표본에 대해 더욱 강력한 검정 방법이다.
- 표본수가 2000 초과할 경우 주로 사용된다.
반응형
'Data 공부 > 통계 & ML' 카테고리의 다른 글
[통계] 다중가설검정 (Multiple Comparison) (0) | 2023.06.20 |
---|---|
[통계] 데이터 스케일링(Skewed 데이터) (0) | 2023.06.14 |
[통계] 이상치 제거 (0) | 2023.06.13 |
[통계] 상관관계(Correlation) (0) | 2023.06.13 |
[통계] 모수 / 비모수 (0) | 2023.06.12 |
Comments