[선형대수 간단정리 with python] 공분산(Covariance), 상관계수(Correlation Coefficient)
1. 공분산(Covariance) 공분산이란? X라는 변수가 변화할 때 Y라는 변수가 어떤 방향성을 가지고 변화하는지를 나타내는 척도이다. 쉽게 말하면, X가 증가할 때 Y가 증가하는지 아니면 감소하는지를 나타낸다. 식으로 표현하면 다음과 같다. $$ E[(X-\mu_{X})(Y-\mu_{Y})] $$ 키와 몸무게를 예로 들어서 파이썬 코드로 살펴보자. import numpy as np h = np.array([170, 188, 165, 176, 160, 181, 178]) w = np.array([65, 82, 58, 68, 50, 71, 70]) cov_hw = np.cov(h, w, ddof = 1) # ddof = 1이면 공분산을 계산할 때 (n-1)로 계산하라는 의미. # 표본을 통해 모집단의 ..