반응형
※ 매번 비슷한 내용을 구글링하는 것에 답답해서 항목별로 정리하는 글
▶ 모델 생성을 위한 raw train set, raw test set
- 분석을 위한 데이터를 불러와서 train, test라는 데이터프레임에 저장하였다.
▶ feature와 label
- feature_names : 모델 생성에 사용할 컬럼 리스트
- 리스트에 포함되는 컬럼들은 전처리를 통해 이상치를 제거하고, 분석에 용이한 형태로 만든다. - label_name : y에 해당하는 컬럼
▶ 모델 생성을 위한 train set, test set
X_train = train[feature_names]
X_test = test[feature_names]
y_train = train[label_name]
▶ 모델 생성
model.fit(X_train, y_train) # 학습
prediction_list = model.predict(X_test) # 예측한 y
요구조건에 따라 predict 대신 predict_proba 사용
- predict : 각 클래스 중 어떤 클래스인지 1개만
- predict_proba : 각 클래스에 대한 확률
반응형
'Data Science : Study > 1. Python' 카테고리의 다른 글
Python : (pandas) One- hot encoding (0) | 2020.05.29 |
---|---|
Python : 데이터분석 - 모델 평가 (0) | 2020.05.25 |
Python : 데이터 시각화 (0) | 2020.05.25 |
Python : (pandas) DataFrame 컬럼 다루기 (0) | 2020.02.28 |
Python : (pandas) DataFrame 날짜 다루기 (0) | 2020.02.28 |