반응형
※ 매번 비슷한 내용을 구글링하는 것에 답답해서 항목별로 정리하는 글
? One-hot encoding ?
하나의 값만 Hot(True, 1)고, 나머지 값은 모두 Cold(False, 0)로 만드는 인코딩
데이터프레임의 특정 컬럼을 one-hot encoding 하고 싶어 : get_dummies (use pandas!)
pd.get_dummies(df["column_name"], prefix = '접두사', drop_first = True)
- prefix: 새로 생기는 더미 컬럼들에 어떤 접두사를 붙일건지 (option)
- drop_first: 더미 컬럼 중 첫번째 컬럼을 자동삭재
→ 더미 컬럼을 만들 경우 n-1개만 있어도 모든 값을 설명 가능하므로 1개를 없앤다 ( dummy trap을 없앤다! )
반응형
'Data Science : Study > 1. Python' 카테고리의 다른 글
모델 : LightGBM (1) | 2020.11.16 |
---|---|
Python : csr_matrix (데이터의 수를 줄이는 방법) (0) | 2020.07.07 |
Python : 데이터분석 - 모델 평가 (0) | 2020.05.25 |
Python : 데이터분석 - 모델 생성 및 예측 (0) | 2020.05.25 |
Python : 데이터 시각화 (0) | 2020.05.25 |