본문 바로가기

Data Science : Study/1. Python

Python : (pandas) One- hot encoding

반응형

※ 매번 비슷한 내용을 구글링하는 것에 답답해서 항목별로 정리하는 글

 

 

? One-hot encoding ?

하나의 값만 Hot(True, 1)고, 나머지 값은 모두 Cold(False, 0)로 만드는 인코딩

 

 

데이터프레임의 특정 컬럼을 one-hot encoding 하고 싶어 : get_dummies (use pandas!)

pd.get_dummies(df["column_name"], prefix = '접두사', drop_first = True)
  • prefix: 새로 생기는 더미 컬럼들에 어떤 접두사를 붙일건지 (option)
  • drop_first: 더미 컬럼 중 첫번째 컬럼을 자동삭재
    → 더미 컬럼을 만들 경우 n-1개만 있어도 모든 값을 설명 가능하므로 1개를 없앤다 ( dummy trap을 없앤다! )

 

 

 

 

 

반응형