다변량 자료분석은 따로 시계열 자료분석 처럼 포스팅을 만들 계획은 없지만
다변량 차원에서 공분산 개념을 위주로 헷갈리는 점이 있어서 해당 부분만 블로그에 저장하듯이 공부하기로 한다.
확률변수 X와 Y가 있을때, X와 Y의 공분산은 정의에 의해서
Cov(X, Y) = E(X - E(X)*(Y - E(Y)) 로 표현된다.
그렇다면 만일, 여러개의 확률변수가 담겨있는 random vector의 공분산은 어떻게 표현되는지 살펴본다.




X, Y가 각각 그저 확률변수인 경우
Cov(X, Y = E(XY) - E(X)E(Y) 임을 배웠다.
그러나 위의 결과처럼 X, Y가 확률변수가 아니라 m차원의 random vector인 경우
Cov( X + Y) = Cov(X) + Cov(Y) 이다.