데이터 정규분포화, 표준화

AI/Preprocessing

데이터 정규분포화, 표준화

oaho 2023. 4. 11. 13:39

데이터의 정규분포화와 표준화는 모델 성능을 개선하고, 변수 간 상관관계와 이상치를 제거할 수 있으며, 머신 러닝 알고리즘에 맞는 입력 데이터를 생성할 수 있도록 도와줍니다.

# 라이브러리 임포트
from sklearn.preprocessing import StandardScaler

# StandardScaler 적용
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)

train dataset을 정규 분포화(fit_transform) 했던 걸로 test dataset에 표준화(transform) 해야 합니다.

'AI > Preprocessing' 카테고리의 다른 글

라벨 인코딩 vs 원핫 인코딩 (0)	2023.04.11
text preprecessing_numpy.argmax() (0)	2023.04.03
이미지들을 배열 데이터셋으로 만들기 (0)	2023.03.22
python_폴더(파일) 복사하기 (copytree, copy_tree) (0)	2023.03.20
python_폴더(파일)명 변경하기 (os.rename) (0)	2023.03.20

현재글데이터 정규분포화, 표준화

공부기록 👩🏻‍💻📒✏️📚📝📙

원핫인코딩, sigmoid, 프로그래머스, 쿠버네티스, 회귀모델성능평가, 선형회귀, 머신러닝 전처리, 백준, 제조데이터, 코딩테스트, CNN, 제조ai, 텍스트전처리, 데이터분석, BAEKJOON, 머신러닝, 회귀모델, 지도학습과 비지도학습, HTML모달창, 딥러닝,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28

코딩하는 짱구

데이터 정규분포화, 표준화

'AI > Preprocessing' 카테고리의 다른 글

'AI/Preprocessing'의 다른글

티스토리툴바

데이터 정규분포화, 표준화

'AI > Preprocessing' 카테고리의 다른 글

'AI/Preprocessing'의 다른글

관련글

티스토리툴바