Statistics: ch6. 질적변수들의 연관성

1. 다항분포

  • 범주형변수(categorical variable): 범주(category)를 값으로 갖는 변수
  • 다항시행 (multinomial trial): 한번의 시행에서 나타날 수 있는 결과가 여러 가지 중의 하나인 시행
  • 다항분포(multinomial distribution)

2. 교차분석 - 카이제곱검정

교차분석은 범주형 자료(명목형이나 순서형 변수)인 두 개의 변수들 간의 연관성(association)을 알아보기 위한 분석으로서 이차원 분할표(contingency table)을 먼저 작성하고 두 변수간의 연관성을 분석한다.

3. 카이제곱 적합도 검정

4. 오즈비 (Odds Ratio)

  • 오즈비(Odds Ratio): 이차원 분할표에서 두 변수간 연관성을 나타내는 하나의 측도
    • $r=n:m=\frac{n}{m}$
    • 예) Odds가 6:1 이라는건 $n=6, m=1$이라는 뜻이고 비율이니 분수로도 표현가능하다.

5. 연관성의 측도

  • 카이제곱 통계량에 근거한 측도
    • 파이 계수(Phi coefficient)
    • 크래머 V (Cramer’s V)
    • 분할계수(Contingency Coefficient)
  • 명목형 변수들의 연관성
    • 람다(Lambda)
  • 순서형 변수들의 연관성
    • 감마(Gamma): 분할표에서 두 순서형 변수 사이의 연관도를 재는 측도
      • 일치쌍(concordant pair): 각 변수에 대한 관측값이 크기 순서에서 같은 방향에 있는 한 쌍의 관측개체
      • 불일치쌍(discordant pair): 각 변수에 대한 관측값이 크기 순서에서 반대방향에 있는 한 쌍의 관측개체
    • 심슨의 역설(Simpson’s Paradox)
      • 분할표 분석에 있어 전체분석결과와 세부분석의 결과가 모순되는 현상

업데이트:

댓글남기기