AI/Preprocessing

데이터 정규분포화, 표준화

oaho 2023. 4. 11. 13:39
반응형

데이터의 정규분포화와 표준화는 모델 성능을 개선하고, 변수 간 상관관계와 이상치를 제거할 수 있으며, 머신 러닝 알고리즘에 맞는 입력 데이터를 생성할 수 있도록 도와줍니다.

 

# 라이브러리 임포트
from sklearn.preprocessing import StandardScaler

# StandardScaler 적용
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)

 

train dataset을 정규 분포화(fit_transform) 했던 걸로 test dataset에 표준화(transform) 해야 합니다.

반응형