해리문의 데이터_log

  • 홈
  • 태그
  • 방명록

f검정 1

[Weekly Paper 4] 데이터 전처리 방법(결측치, 이상치 처리 / 범주형 변수 처리)과 T-TEST

데이터 전처리 방법정의데이터를 분석 및 처리에 적합한 형태로 만드는 과정을 총칭종류1) 범주형 변수 처리 - 원 핫 인코딩카테고리별 이진 특성을 만들어 해당 특성을 1, 나머진 모두 0으로 만드는 0것. 회귀 분석에서 범주형 변수는 사용할 수 없기에 문자로 되어있는 범주 변수를 숫자로 변환해야한다.독립 범주의 경우에는 독립적인 특성을 보존해야 회귀 분석 해석 명확해지므로 각 변수들이 서로 독립적으로 회귀 분석에 기여하도록 만들어주어야 한다.ex. 흡연 여부 - 흡연하지 않음(000) / 흡연했으나 끊었다.(001) / 흡연하고 있다.(002)위 범주형 변수들을 원핫인코딩을 해주어 독립적인 변수로 만들었지만, 결국엔 하나를 가리키는 특성을 갖기 떄문에 다중 공산성 문제가 발생할 수 있다. 이를 방지하기 위..

DA Study/Weekly Paper 2024.12.17
이전
1
다음
프로필사진

해리문의 데이터_log

#데이터 #공감 #러닝커브 #성장

  • 전체 (115)
    • DA Study (106)
      • Data Analytics (11)
      • TIL (83)
      • Weekly Paper (12)
    • Data Unpacking #아티클 #역분석 (3)
    • Coding Test (6)
      • Algorithm #Python3 (6)

Tag

코테, 코딩테스트, sql공부, Python, weeklypaper, 세그먼트분석, 쿼리, 데이터분석, 서브쿼리, SQL문제, 윈도우함수, MySQL, 통계, solvesql, SQLite, til, SQL문제풀이, 파이썬, 데이터, SQL,
해리문 GitHub

Copyright © Kakao Corp. All rights reserved.

  • GitHub

티스토리툴바

개인정보

  • 티스토리 홈
  • 포럼
  • 로그인

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.