본문 바로가기

ADP 실기준비2

[ADP 실기] 1.1.1 데이터 전처리 - 이상치 확인 및 결측값 처리 목차 단순대치 & centralimputation (평균, 모드, 빈번한값, 일정한값 등) 다중 대치 단순확률 대치 (Hot-deck, nearest neighbor) knnImputation 1. 단순대치 & 평균대치 단순대치 - 결측값이 존재하는 레코드를 삭제하는 기법 평균대치 - 관측 또는 실험을 통해 얻어진 데이터의 평균으로 대치하는 기법 비조건부 평균대치법 : 기초통계량을 통해 대치 조건부 평균대치법 : 회귀분석을 활용한 대치법 import numpy as np from sklearn.impute import SimpleImputer # 수치형 데이터 - 평균값으로 대치 imp = SimpleImputer(missing_values=np.nan, strategy='mean') # 카테고리형 데이.. 2022. 11. 1.
[ADP 실기] 0. 실기사전준비 - 공부 목표설정 2022-10-01 ADP필기시험을 합격하고 실기를 준비하기 위해 작성한 공부리스트이다. 아래 내용은 내용은 , , , 그리고 를 기반으로 작성하였다. 공부 목차 데이터 전처리 및 데이터 분할 전처리 이상치 확인 및 결측값 처리: 단순대치(Single Imputation), 단순확률 대치(Single Stochastic Imputation), 다중 대치(Multiple Imputation), knnImputation, centralimputation 데이터 불균형 문제 처리 : 업샘플링 (SMOTE, Boaderline SMOTE, Adasyn), 다운샘플링 이상값 처리: 극단값 절단, 조정 변수 변환, 스케일링: 수치형 변수 변환(로그변환, 제곱근변환, 지수변환, 제곱변환, Box-cox 변환, 표준화.. 2022. 10. 31.

출처: https://privatedevelopnote.tistory.com/81 [개인노트]