회귀분석 4

[Weekly Paper 11] 지도학습, 비지도학습, 손실함수

Q: 지도학습과 비지도학습의 차이두 학습 방법은 머신러닝의 주요 학습 방법입니다. 지도 학습(Supervised Learning)입력 데이터(특징, Feature)와 정답(레이블, Label)이 주어진 상태에서 학습하는 방식모델이 주어진 정답을 예측하도록 학습주요 알고리즘: 선형 회귀, 로지스틱 회귀, 결정 트리, 랜덤 포레스트, SVM, 신경망 등예제: 이메일 스팸 필터링(스팸 or 정상 메일), 이미지 분류(고양이 vs 강아지)비지도 학습(Unsupervised Learning)정답(레이블) 없이 데이터의 패턴이나 구조를 학습하는 방식데이터 내 숨겨진 관계나 그룹을 찾는 데 사용됨주요 알고리즘: K-평균(K-Means) 클러스터링, DBSCAN, 계층적 클러스터링, PCA(주성분 분석) 등예제: 고객..

[머신러닝] 선형 회귀(Linear Regression), 경사하강법, RMSE

선형 회귀(Linear Regression)용어머신러닝지도 학습 -선형 회귀가 속함 1) 분류 - 몇가지 정답 중에 고르는 것 2) 회귀 - 연속적인 값을 예측하는 것비지도 학습강화 학습선형 회귀데이터에 가장 잘 맞는 가설 함수를 찾아야함.목표 변수 : 맞추려고 하는 값(target variable / output variable)입력 변수 : 맞추는데 사용하는 값(input variable / feature)학습 데이터 : 프로그램을 학습 시키기 위해 사용하는 데이터개수 : m입력변수 : x (위에 작은 괄호에 숫자(n)넣어서 n번째 데이터의 x값 표현)목표변수 : y (위에 작은 괄호에 숫자(n)넣어서 n번째 데이터의 y값 표현)선형회귀로 최적선을 찾아내서 미래를 예측한다.가설 함수 : 머신러닝에..

[TIL] 로지스틱 회귀분석에서 오즈비 해석하기 # python # 부트캠프

부트캠프 프로젝트 - 구독 서비스 플랫폼 데이터 분석 프로젝트[ 문제 상황 ]로지스틱 회귀분석을 해석하는 오즈비에 대해 잘못 이해하여 해석을 정확하지 못하게 헀다는 사실을 깨달았다.[ 해결 ]오즈비는 특정 사건의 성공확률(p) / 실패확률(1-p) 이므로, 오즈비가 1이 상이면 해당 사건이 발생할 확률이 50%를 넘게 되며, 발생할 확률이 발생하지 않을 확률보다 높아진다는 결론을 내릴 수 있다. 이러한 방향으로 독립변수의 오즈비를 해석하였다.ex) A라는 독립변수의 오즈비가 1.2이면, p/1-p = 1.2 이므로 > p = 0.545A가 종속변수를 발생시킬 확률이 0.545종속변수가 이진수이므로 아무 변수도 없을 때 0.5라고 가정할 수 있기 때문에 A가 종속변수가 발생할 확률을 약 4.5%p 상승시킨..

DA Study/TIL 2025.01.17

[TIL] 로지스틱 회귀분석에서 오즈비 계산하기 # python # 부트캠프

부트캠프 프로젝트 - 구독 서비스 플랫폼 데이터 분석 프로젝트# 회귀계수에서 오즈비 계산odds_ratios = np.exp(result.params)# 오즈비 출력 odds_ratios_df = pd.DataFrame( { 'Feature': X.columns, 'Odds Ratio': odds_ratios })print(odds_ratios_df)[ 문제 상황 ]로지스틱 회귀분석 결과를 해석할 때 회귀 계수 만으로 해석하기 어렵다.[ 해결 ]오즈비를 통해 해석의 용이성을 챙길 수 있다.numpy 라이브러리에서 지수 함수 메서드인 np.exp() 를 통해 간단하게 오즈비를 구할 수 있다.로지스틱 회귀모델에서는 각 회귀계수가 로그 오즈(log-odds) 의 변화..

DA Study/TIL 2025.01.13