본문 바로가기

Data Science : Study/1. Python

Python : 데이터분석 - 모델 생성 및 예측

반응형

※ 매번 비슷한 내용을 구글링하는 것에 답답해서 항목별로 정리하는 글

 

 

▶ 모델 생성을 위한 raw train set, raw test set

  • 분석을 위한 데이터를 불러와서 train, test라는 데이터프레임에 저장하였다.

 

▶ feature와 label

  • feature_names : 모델 생성에 사용할 컬럼 리스트
    - 리스트에 포함되는 컬럼들은 전처리를 통해 이상치를 제거하고, 분석에 용이한 형태로 만든다.
  • label_name : y에 해당하는 컬럼

 

▶ 모델 생성을 위한 train set, test set

X_train = train[feature_names]
X_test = test[feature_names]
y_train = train[label_name]

 

모델 생성

model.fit(X_train, y_train)                 # 학습
prediction_list = model.predict(X_test)	    # 예측한 y

요구조건에 따라 predict 대신 predict_proba 사용

  • predict : 각 클래스 중 어떤 클래스인지 1개만
  • predict_proba : 각 클래스에 대한 확률

 

 

 

 

 

반응형