목차
- 가설 검정 개요
- 가설 검정 절차
1. 가설 검정 개요
통계적 가설 검정이란 데이터를 사용하여 어떠한 주장이나 가설이 옳은지를 결정하는 과정을 통계적인 방법을 통해 수행하는 것을 뜻한다. 여기서 두 가지의 키워드가 중요하다.
- 모집단: 통계적인 분석이나 추론의 대상이 되는 전체 집단. 연구자가 알고 싶어하는 대상
- 표본: 모집단의 부분집합. 연구자가 측정 또는 관찰한 결과들의 집합
즉, 가설 검정을 한다는 것은 연구자가 관찰한 표본들에 대하여 특정 통계 방법을 사용하여 모집단의 특성을 추론하고 일반화하는 과정이다. 연구자가 세운 가설에 대하여 데이터를 바탕으로 수치적인 근거를 제시하는 과정이기 때문에 데이터 분석 업무에서 중요한 요소라고 할 수 있다.
2. 가설 검정 절차
- 가설 검정: 귀무가설과 대립가설 설정
- 귀무가설: 일반적으로 어떤 변화나 효과가 없다는 것을 주장
- 대립가설: 귀무가설을 기각하고자 하는 주장
- 검정 통계량 선정
- 표본 데이터를 사용하여 가설 검정을 수행하는데 사용되는 통계량. 선택된 가설 검정 방법과 관련이 있음
- 가설 검정 방법
- t-검정 통계량: 두 집단 간의 평균 차이 비교. 두 집단의 표본 평균과 표준 편차를 사용하여 계산
- z-검정 통계량: 모집단의 평균이나 비율에 대한 가설 검정. 표준 정규 분포의 특정 점수를 계산하여 비교
- F-검정 통계량: 두 개 이상의 집단의 분산 차이 비교. 주로 분산 분석 (ANOVA)에서 사용되며 집단 간 및 집단 내 분산 비교
- 카이제곱 통계량: 두 범주형 변수 간의 관계 검정. 관찰된 빈도와 기대된 빈도 사이의 차이 측정
- 특정 문제 또는 가설에 따라 다양한 검정 통계량이 사용되며, 더 자세한 내용은 관련 포스트를 통해 다룰 예정이다.
- 유의수준 설정
- 유의수준: 귀무가설을 기각하기 위한 임계값. 일반적으로 사용되는 유의수준은 0.05 또는 0.01
- 표본 추출 및 데이터 수집
- 가설 검정에 사용할 표본 데이터 수집
- 통계량 계산
- 표본 데이터를 사용하여 가설에 적절한 검정 통계량 계산
- 귀무가설 검정
- 계산된 검정 통계량을 사용하여 귀무가설 검정. 통계적인 방법을 사용하여
- 결과 해석 및 결론 도출
- 계산된 검정 통계량을 사용하여 귀무가설 검정