부트캠프 프로젝트
- 구독 서비스 플랫폼 데이터 분석 프로젝트
[ 문제 상황 ]
- 로지스틱 회귀분석을 해석하는 오즈비에 대해 잘못 이해하여 해석을 정확하지 못하게 헀다는 사실을 깨달았다.
[ 해결 ]
오즈비는 특정 사건의 성공확률(p) / 실패확률(1-p) 이므로, 오즈비가 1이 상이면 해당 사건이 발생할 확률이 50%를 넘게 되며, 발생할 확률이 발생하지 않을 확률보다 높아진다는 결론을 내릴 수 있다. 이러한 방향으로 독립변수의 오즈비를 해석하였다.
ex) A라는 독립변수의 오즈비가 1.2이면, p/1-p = 1.2 이므로 > p = 0.545
- A가 종속변수를 발생시킬 확률이 0.545
- 종속변수가 이진수이므로 아무 변수도 없을 때 0.5라고 가정할 수 있기 때문에 A가 종속변수가 발생할 확률을 약 4.5%p 상승시킨다고 해석
[ 회고 ]
로지스틱 회귀분석 결과를 해석하는 과정에서 오즈비(Odds Ratio)를 잘못 이해하여 부정확한 결론을 내린 사실을 깨달았다. 오즈비는 특정 사건이 발생할 확률(p)을 발생하지 않을 확률(1-p)로 나눈 값으로, 이 값이 1보다 크면 사건이 발생할 확률이 50%를 넘어 발생하지 않을 확률보다 높아진다는 의미를 가진다. 이를 바탕으로 독립변수의 오즈비를 올바르게 해석하며 문제를 해결할 수 있었다.
이 경험을 통해 통계적 개념의 정확한 이해가 데이터 해석에서 얼마나 중요한지 깨닫게 되었다. 오즈비와 같은 통계적 지표는 분석 결과의 해석과 의사결정에 직접적인 영향을 미치기 때문에, 개념을 명확히 이해하고 이를 바탕으로 해석해야만 신뢰성 있는 결론을 도출할 수 있다는 점을 배웠다.
또한 분석 과정에서 실수를 발견했을 때 이를 받아들이고 개선하려는 자세가 중요하다는 점도 실감했다. 잘못된 해석을 정정하고 올바른 방향으로 수정하는 과정을 통해 통계적 사고와 데이터 분석 역량을 더욱 발전시킬 수 있었다. 앞으로는 통계적 지표의 정의와 의미를 명확히 이해하고, 이를 바탕으로 객관적이고 신뢰성 있는 결론을 도출하는 데 주의를 기울일 것이다.
'DA Study > TIL' 카테고리의 다른 글
[TIL] MySQL 정규식 REGEXP AND, OR 조건 # MySQL # SQL (1) | 2025.01.22 |
---|---|
[TIL] MySQL 정규식 REGEXP (Regular Expression) # MySQL # SQL (0) | 2025.01.19 |
[TIL] 집단 간 비율 차이 통계적 유의미성 검증하기 - Z검정 # python # 부트캠프 (1) | 2025.01.15 |
[TIL] 특정 값으로 편향된 데이터 전처리하기 # python # 부트캠프 (1) | 2025.01.14 |
[TIL] 로지스틱 회귀분석에서 오즈비 계산하기 # python # 부트캠프 (0) | 2025.01.13 |