머신러닝/데이터 분석
T-test
haong_
2022. 6. 14. 15:52
T-test란? 평균을 비교 할 수 있는 통계 가설 검정법
One sample t test
모집단 평균이 μ와 같은지 아닌지 검정
귀무가설 : 모집단 평균은 μ와 차이가 없을 것이다
대립가설 : 차이가 있을 것이다(크거나 작거나)
평균에 차이가 있을 때
- 평균보다 크다 작다를 검정하고 싶을 경우 유의수준은 한쪽 방향에서만 존재하게 된다 one tail
- 평균과 같다 같지 않다를 검정하고 싶을 경우 유의수준은 양쪽으로 나뉘어서 존재 two tail 만약 유의수준이 5%라면 한쪽에 2.5%씩 나뉨
검정하고 싶은 방법에 따라 one sample one tail, two tail 로 나뉜다!(헷갈리지 말것)
Two sample t test
두 표본집단 간의 평균의 차이가 있는지 검정
귀무가설 : 표본집단 간 평균의 차이가 없다
대립가설 : 통계적으로 유의미한 차이가 있다
두 집단의 검정이므로 two tail 만 존재
간단한 예제를 들어보자
남자 평균키와 여자 평균키 차이가 얼마나 날지
남자 표본 그룹 : [170, 165, 168, 180, 175, 174]
여자 표본 그룹 : [165, 162, 158, 170, 163, 154]
남자 표본 평균 = 172 표준편차 = 5.40
여자 표본 평균 = 162 표준편차 = 5.55
표준 오차(SEM) = 10.9 / √12 = 3.16
자유도는 6+6-2 = 10
자유도 10에 해당하는 양측 꼬리부분을 제외한 넓이가 0.95인 t-value = 2.228
95% 신뢰구간 길이는 t-value와 표준오차를 곱한 2.228 X 3.16 = 7.04
따라서 남자 여자 평균키 차이에 대한 95% 신뢰구간은 평균차이 10에 +- 7.04
10 - 7.04 = 2.96
10 + 7.04 = 17.04
2.96 ~ 17.04 사이에 남자 여자 키의 모평균 차이가 존재할 확률이 95%