상관계수 2

[TIL] 집계 함수와 연산 함수를 활용한 피어슨 상관계수 구하기 #SQL #SQLite #solvesql

solvesql - 펭귄 날개와 몸무게의 상관 계수👉 문제 바로가기(solvesql)-- 날개 길이와 몸무게의 피어슨 상관 계수(Pearson Correlation Coefficient)를 구하는 쿼리WITH avg_t AS( SELECT species, AVG(flipper_length_mm) as avg_length, AVG(body_mass_g) as avg_mass FROM penguins GROUP BY species)SELECT t1.species, ROUND((SUM((t1.flipper_length_mm - t2.avg_length)*(t1.body_mass_g-t2.avg_mass)))/ (SQRT(SUM(POWER((t1.flipper_le..

DA Study/TIL 2025.02.25

[통계] 피어슨 상관계수와 공분산

공분산 : 두 변수 간의 관계의 방향성과 강도를 측정할 때 사용할 수 있는 통계값수식상 하나의 변수가 증가할 때 다른 변수도 증가하는 경향이 있다면 공분산 값은 양수가 되고, 하나의 변수가 증가할 때 다른 변수는 감소한다면 공분산 값은 음수공분산 값의 크기는 변수의 단위에 큰 영향을 받는다는 한계가 있음(ex. 두 변수의 단위가 무게(kg), 길이(km)일 경우 이 단위에 따라 공분산 값의 범위가 크게 달라짐)-> 공분산 값이 크게 나왔을 때, 정말로 상관관계가 커서 그런 건지, 변수의 단위 때문에 숫자가 커서 그런 건지 판단 불가-> 공분산 만으로는 상관관계 강도 비교 해석이 어려움$$cov(X,Y) = \frac{\sum_{i=1}^{n}(X_i - \bar{X})(Y_i - \bar{Y}) }{n}..