sitelink1  
sitelink2  

KurtosisSkewness는 데이터 분포의 형태를 설명하는 두 가지 중요한 통계적 척도입니다.

이들은 주로 데이터가 정규분포(Normal Distribution)와 비교해 대칭성이나 꼭짓점(꼬리)의 형태에서 얼마나 다른지를 분석할 때 사용됩니다.

1. Skewness (왜도)

Skewness는 데이터의 비대칭성을 측정합니다.

즉, 데이터 분포가 평균을 중심으로 얼마나 대칭적이지 않은지를 나타냅니다.

  • 양의 왜도 (Positive Skewness): 오른쪽 꼬리가 길고, 데이터가 왼쪽에 더 많이 몰려 있는 경우. 평균이 중앙값보다 큽니다.
    • 예: 소득 분포처럼 많은 사람들이 낮은 소득을 가지고, 일부 사람들이 매우 높은 소득을 가질 때.
  • 음의 왜도 (Negative Skewness): 왼쪽 꼬리가 길고, 데이터가 오른쪽에 더 많이 몰려 있는 경우. 평균이 중앙값보다 작습니다.
    • 예: 시험 성적처럼 대부분의 학생이 높은 성적을 가지고, 소수의 학생이 낮은 성적을 가질 때.

사용 용도:

  • 비즈니스: 판매 데이터에서 이상값을 분석할 때, 판매량이 특정 구간에 집중되어 있는지, 극단적인 값이 많은지 분석합니다.
  • 금융: 자산 수익률의 왜도를 분석하여, 자산 가격이 어떻게 분포되는지, 리스크가 어느 쪽으로 치우쳐 있는지 판단합니다.

예시:

Skewness=n(n1)(n2)((xixˉ)3s3)

  • xix_i: 개별 값
  • xˉ\bar{x}: 평균
  • ss: 표준편차
  • Skewness가 0에 가까우면 대칭적인 분포, 0보다 크면 오른쪽으로, 작으면 왼쪽으로 비대칭적인 분포입니다.

2. Kurtosis (첨도)

Kurtosis는 데이터의 분포가 평균 근처나 꼬리 부분에서 얼마나 두터운지(꼬리의 뾰족함)를 측정합니다.

다시 말해, 분포가 꼬리가 두꺼운지 또는 뾰족한지를 나타냅니다.

  • Leptokurtic (첨도가 큰 분포): 꼬리가 두꺼워서 극단적인 값이 자주 발생합니다. 정규분포보다 꼬리가 더 두꺼운 분포를 의미합니다.
    • 예: 금융 시장의 극단적인 변동.
  • Platykurtic (첨도가 작은 분포): 꼬리가 얇고 극단적인 값이 잘 발생하지 않습니다. 정규분포보다 덜 뾰족한 분포를 나타냅니다.
    • 예: 안정적인 시장이나, 안정된 제품의 판매량.
  • Mesokurtic (정규분포와 유사한 첨도): 정규분포와 비슷한 분포. 정규분포의 kurtosis는 3으로 설정됩니다.

사용 용도:

  • 금융: 자산의 수익률이 극단적인 리스크를 가지는지(꼬리가 두꺼운지) 분석할 때.
  • 품질 관리: 제품의 특성 분포가 정규분포와 비교해 얼마나 안정적인지 또는 극단적인 값이 자주 나타나는지를 확인할 때.

예시:

Kurtosis=n(n+1)(n1)(n2)(n3)((xixˉ)4s4)3(n1)2(n2)(n3)

  • xix_i: 개별 값
  • xˉ\bar{x}: 평균
  • ss: 표준편차
  • Kurtosis가 3보다 크면 극단적인 값이 많고, 3보다 작으면 분포가 더 평평합니다.

차이점 요약:

  • Skewness는 분포의 대칭성을 측정합니다. (오른쪽으로 치우침 또는 왼쪽으로 치우침)
  • Kurtosis는 분포의 꼬리 두께뾰족함을 측정합니다. (극단값의 발생 빈도)

사용 예시:

  • Skewness와 Kurtosis는 데이터의 정상성(정규성을 가정하는지 여부)을 판단하는 데 사용되며, 데이터의 분포 형태를 이해하고, 이상값을 분석하거나, 리스크 평가에 활용됩니다.