반응형
데이터의 정규분포화와 표준화는 모델 성능을 개선하고, 변수 간 상관관계와 이상치를 제거할 수 있으며, 머신 러닝 알고리즘에 맞는 입력 데이터를 생성할 수 있도록 도와줍니다.
# 라이브러리 임포트
from sklearn.preprocessing import StandardScaler
# StandardScaler 적용
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)
train dataset을 정규 분포화(fit_transform) 했던 걸로 test dataset에 표준화(transform) 해야 합니다.
반응형
'AI > Preprocessing' 카테고리의 다른 글
| 라벨 인코딩 vs 원핫 인코딩 (0) | 2023.04.11 |
|---|---|
| text preprecessing_numpy.argmax() (0) | 2023.04.03 |
| 이미지들을 배열 데이터셋으로 만들기 (0) | 2023.03.22 |
| python_폴더(파일) 복사하기 (copytree, copy_tree) (0) | 2023.03.20 |
| python_폴더(파일)명 변경하기 (os.rename) (0) | 2023.03.20 |