머신러닝 4

[Weekly Paper 12] 머신러닝 편향과 분산, 과적합과 과소적합,

Q: 모델 학습 시 발생할 수 있는 편향과 분산, 두 개념의 관계?편향(Bias)과 분산(Variance)은 머신러닝 모델의 성능과 일반화 능력을 평가하는 핵심 개념입니다.이 두 가지 개념은 “Bias-Variance Tradeoff (편향-분산 트레이드오프)” 라는 관계로 연결됩니다.1. 편향(Bias)모델이 학습 데이터의 패턴을 충분히 학습하지 못했을 때 발생하는 오류단순한 모델(Underfitting, 과소적합)이 높은 편향을 가짐편향(Bias)이 크면 단순한 모델이 되어 과소적합(Underfitting)이 발생예측값이 정답과 크게 차이나며, 데이터의 복잡한 관계를 제대로 학습하지 못함예시선형 회귀 모델이 매우 복잡한 곡선 데이터를 학습할 때, 직선으로 단순히 예측하면 높은 편향을 가짐모두 평균값으..

[Weekly Paper 11] 지도학습, 비지도학습, 손실함수

Q: 지도학습과 비지도학습의 차이두 학습 방법은 머신러닝의 주요 학습 방법입니다. 지도 학습(Supervised Learning)입력 데이터(특징, Feature)와 정답(레이블, Label)이 주어진 상태에서 학습하는 방식모델이 주어진 정답을 예측하도록 학습주요 알고리즘: 선형 회귀, 로지스틱 회귀, 결정 트리, 랜덤 포레스트, SVM, 신경망 등예제: 이메일 스팸 필터링(스팸 or 정상 메일), 이미지 분류(고양이 vs 강아지)비지도 학습(Unsupervised Learning)정답(레이블) 없이 데이터의 패턴이나 구조를 학습하는 방식데이터 내 숨겨진 관계나 그룹을 찾는 데 사용됨주요 알고리즘: K-평균(K-Means) 클러스터링, DBSCAN, 계층적 클러스터링, PCA(주성분 분석) 등예제: 고객..

[머신러닝] 선형 회귀(Linear Regression), 경사하강법, RMSE

선형 회귀(Linear Regression)용어머신러닝지도 학습 -선형 회귀가 속함 1) 분류 - 몇가지 정답 중에 고르는 것 2) 회귀 - 연속적인 값을 예측하는 것비지도 학습강화 학습선형 회귀데이터에 가장 잘 맞는 가설 함수를 찾아야함.목표 변수 : 맞추려고 하는 값(target variable / output variable)입력 변수 : 맞추는데 사용하는 값(input variable / feature)학습 데이터 : 프로그램을 학습 시키기 위해 사용하는 데이터개수 : m입력변수 : x (위에 작은 괄호에 숫자(n)넣어서 n번째 데이터의 x값 표현)목표변수 : y (위에 작은 괄호에 숫자(n)넣어서 n번째 데이터의 y값 표현)선형회귀로 최적선을 찾아내서 미래를 예측한다.가설 함수 : 머신러닝에..

[머신러닝] 머신러닝 정의, 유형, 기본 개념, 수학적 기초

머신 러닝 이란?기계가 학습한다는 건, 프로그램이 특정 작업(T)을 하는 데 있어서 경험(E)을 통해 작업의 성능(P)을 향상시키는 것스팸 메일 분류 프로그램작업 : 스팸 분류경험 : 새로운 이메일 보고성능 : 스팸 분류 얼마나 잘하는가(분류 확률)머신러닝에 관심이 증가한 이유데이터 양이 늘어남예전에는 데이터 양이 충분하지 못해서 머신러닝 못했다. 요즘에는 PC, 웹, 스마트폰 환경이 조성되며 데이터가 많이 쌓기 시작함, 데이터가 기하급수적으로 늘어남. 컴퓨터 성능이 좋아짐연산 비용 매우 줄어듦활용성 증명됨ex) 유튜브 : 시청 데이터 쌓임 > 분석 > 데이터 기반 맞춤 영상 추천/광고 노출 > 재방문, 체류 시간 증가 > 데이터 증가 > 반복인공지능 / 빅데이터 / 머신러닝빅데이터 : 엄청나게 많은 양..