본문 바로가기

Data/Statistics

통계 실습 : 다양한 통계분석 방법, 언제 사용할까?

독학으로 통계를 공부하다 보니 개념만 이해하고 다양한 분석 기법들이 어떻게 활용되는지는 잘 모르는 경우가 많습니다. 저 또한 그렇습니다. 오늘은 다양한 통계분석 방법들이 언제 어떻게 사용되는지 간단한 예시를 통해 살펴보도록 하겠습니다.

 

설명하는 예제는 어느 정도 통계분석 방법에 대한 개념은 이해하고 있다고 가정하고 있기 때문에 해당 분석 방법의 개념을 전혀 모른다면 왜 이런 분석방법을 사용하는지 이해하기 어려울 수도 있으니 개념을 먼저 이해하시고 보시면 좋을 것입니다.

 

 

가상의 표본 30대 남성 100명과 여성 100명이 있다고 가정해봅니다.

 

1. 독립표본 t 검정

남성과 여성의 평균 키를 비교했을 때, 두 집단의 신장 차이가 유의한지 비교하고 싶은 경우

 

2. 대응표본 t 검정

여성 100명을 대상으로 다이어트 약 복용 전과 후의 체중을 비교해 약의 효과를 확인하고 싶은 경우
(단, 식사량, 운동량 등은 먹기 전/후가 동일하다고 가정)

 

3. 카이제곱검정

남성 100명과 여성 100명에게 야구와 축구 중 어느 스포츠를 더 좋아하는지 선택하게 한 뒤, 선호 비율(야구vs.축구)에 차이가 있는지 알고 싶은 경우

 

표본에 40대, 50대 남성을 각 100명씩 더 추가해보겠습니다. 그리고 30대 남성을 포함해 연령대 별로 100명씩 총 300명의 소득을 조사하였습니다. 

 

4. 일원분산분석(One-way ANOVA)

30대, 40대, 50대 남성 세 그룹 간의 소득 차이가 유의한지 비교하고 싶은 경우

 

5. 사후검정

p-value가 0.05보다 낮게 나왔습니다. 결과적으로 세 집단의 소득이 같지 않다는 것을 말해주는데, 어느 그룹에서 차이가 있는지는 알고 싶은 경우

 

6. 상관관계 분석

소득수준 이외에도 표본에 대한 다양한 정보(신장, 체중, 학력, 결혼여부, 가족수, 거주지 등)들이 있습니다. 이를 통해 변수들간에 상관관계가 높은 변수들이 무엇인지 확인해보고 싶은 경우

 

7. 회귀분석

상관분석을 이용해 소득수준과 상관관계가 높은 변수들을 확인하였습니다. 이 변수들을 독립변수로 하여 종속변수인 소득을 예측하는 모델을 만들어보고자 할 경우 

 

 

참고 : 주요 통계뿐석들 한번에 훑어보기 (VER.202109)