Data Science : Study/1. Python
Python : (pandas) One- hot encoding
신개념솔개
2020. 5. 29. 11:11
반응형
※ 매번 비슷한 내용을 구글링하는 것에 답답해서 항목별로 정리하는 글
? One-hot encoding ?
하나의 값만 Hot(True, 1)고, 나머지 값은 모두 Cold(False, 0)로 만드는 인코딩
데이터프레임의 특정 컬럼을 one-hot encoding 하고 싶어 : get_dummies (use pandas!)
pd.get_dummies(df["column_name"], prefix = '접두사', drop_first = True)
- prefix: 새로 생기는 더미 컬럼들에 어떤 접두사를 붙일건지 (option)
- drop_first: 더미 컬럼 중 첫번째 컬럼을 자동삭재
→ 더미 컬럼을 만들 경우 n-1개만 있어도 모든 값을 설명 가능하므로 1개를 없앤다 ( dummy trap을 없앤다! )
반응형