Linear Algebra (2021/3/19)
오늘은 차원축소를 배우기 전에 필수요소인 벡터의 span과 rank, 그리고 linear projection을 배웠다. 기초적인 것이기에 따로 다루지는 않겠지만 공분산과 상관관계에 대해서 reference차원으로 적어보려고 한다.
Linear Projection
P벡터는 a벡터가 b벡터의 투영된 벡터이다. 투영벡터 및 투영값을 구하는 공식은 다음과 같다.
공분산(Covariance)
- X와 Y의 관계를 (-∞,∞)사이의 값으로 나타냄
- 변수들의 단위값이 다른 경우에는 다른변수간의 관계성을 비교하기에 무리가 있음
- 변수들이 숫자의 형태로 있어야만 계산이 가능
상관관계(Correlation)
- 공분산과 똑같이 X와 Y의 관계를 (-1~1)사이의 값으로 나타냄
- 공분산의 문제를 보안하여 나타낸 것으로 각 변수의 표준편차의 곱을 공분산에 나누어 Scaling한 기법
- 변수들이 숫자의 형태로 있어야만 계산이 가능
Spearman's Correlation
- 범주형 데이터의 상관계수를 구하는 방식이다.
- 범주형 데이터의 순위를 매겨 계산을 한다.
- 순위가 정수가 아닐때는...
- 순위가 정수일때는...
- 샘플의 크기 = n
- 순위별 거리 = d
'[코드스테이츠] AI부트캠프2기 > Section 1' 카테고리의 다른 글
[AI부트캠프] Section 1 정리하며... (feat. 코드스테이츠) (0) | 2021.04.02 |
---|---|
[AI부트캠프 2기] - 13일차 (feat. 코드스테이츠) (0) | 2021.03.22 |
[AI부트캠프 2기] - 11일차 (feat. 코드스테이츠) (0) | 2021.03.18 |
[AI부트캠프 2기] - 10일차 (feat. 코드스테이츠) (0) | 2021.03.17 |
[AI부트캠프 2기] - 9일차 (feat. 코드스테이츠) (0) | 2021.03.17 |
댓글