sitelink1  
sitelink2  

공분산(Covariance)은 두 개의 변수가 어떻게 함께 변하는지를 측정하는 통계적 개념입니다.

즉, 한 변수가 변할 때 다른 변수가 어떻게 변하는지를 나타내며, 두 변수 간의 선형 관계를 나타냅니다.

1. 공분산의 의미

  • 양의 공분산: 한 변수가 증가할 때, 다른 변수도 증가하는 경향이 있습니다. 즉, 두 변수는 같은 방향으로 변화합니다.
  • 음의 공분산: 한 변수가 증가할 때, 다른 변수는 감소하는 경향이 있습니다. 즉, 두 변수는 반대 방향으로 변화합니다.
  • 공분산이 0: 두 변수는 서로 독립적으로 변하며, 선형적인 상관관계가 없습니다.

2. 공분산 공식

공분산은 다음과 같은 수식으로 계산됩니다:

Cov(X,Y)=1ni=1n(XiXˉ)(YiYˉ)

  • XXYY: 두 변수
  • XiX_iYiY_i: 각각의 데이터 값
  • Xˉ\bar{X}Yˉ\bar{Y}: 각각의 변수의 평균
  • nn: 데이터의 개수

3. 공분산과 상관계수의 차이

공분산은 두 변수 간의 선형 관계의 크기방향을 나타내지만, 공분산의 값은 두 변수의 단위에 따라 달라집니다.

그래서 공분산의 크기는 절대적인 의미가 없을 수 있습니다.

이를 해결하기 위해 상관계수(Correlation Coefficient)를 사용합니다.

상관계수는 공분산을 두 변수의 표준편차로 나눈 값으로, -1과 1 사이의 값으로 정규화되어 두 변수 간의 관계를 보다 직관적으로 이해할 수 있습니다.

Correlation(X,Y)=Cov(X,Y)σXσY

  • σX\sigma_XσY\sigma_Y: 각각의 변수의 표준편차

4. 공분산의 사용 예시

  • 주식시장: 두 주식의 가격 변동이 얼마나 함께 변하는지를 분석하는 데 사용됩니다.
    양의 공분산이 크면, 두 주식이 함께 오르고 내리는 경향이 강하다는 것을 의미합니다.
  • 데이터 분석: 변수 간의 관계를 파악하여 상관관계를 분석할 때 사용됩니다.

5. 공분산의 해석

  • 양수: 두 변수가 같은 방향으로 움직임 (같이 증가 또는 같이 감소)
  • 음수: 두 변수가 반대 방향으로 움직임 (하나는 증가하고, 다른 하나는 감소)
  • 0: 두 변수 간의 선형 관계가 없음

예시:

  1. 주식 A와 B의 가격이 공분산을 통해 분석된다면, 공분산 값이 양수이면 두 주식이 비슷한 패턴으로 가격이 변한다는 의미이고, 음수이면 서로 반대 방향으로 변동할 수 있다는 것을 의미합니다.

공분산은 데이터의 패턴을 파악하고, 변수 간의 관계를 이해하는 중요한 도구입니다.