본문 바로가기

Data Science : Study/1. Python

Python : 데이터 시각화

반응형

※ 매번 비슷한 내용을 구글링하는 것에 답답해서 항목별로 정리하는 글

 

 

▶ 시각화에 필요한 패키지

import seaborn as sns
  • matplotlib을 기반으로 하는 파이썬 시각화 패키지
  • 실습용 데이터를 내장하고 있음
import matplotlib.pyplot as plt
  • 파이썬에서 자료를 차트(chart)나 플롯(plot)으로 시각화(visulaization)하는 패키지
  • 정형화된 차트나 플롯 이외에도 저수준 api를 사용한 다양한 시각화 기능을 제공

 

 

 

한번에 여러 그래프를 보여주고 싶어

figure, ( (ax1, ax2, ax3) , (ax4, ax5, ax6) ) = plt.subplots(nrows = 2, ncols = 3)
  • subplot과 달리 한번에 설정을 결정할 수 있다.

 

figure의 크기를 조절하고 싶어 (단위: inch)

plt.figure(figsize = (12, 4))

 

▶ figure를 이미 만든 후에 크기를 조절하고 싶어 (단위: inch)

figure.set_size_inches(18, 8)

 

x축의 제목을 컬럼명으로 하자

ax.set(xlabel = 컬럼명)

 

막대그래프 : seaborn.countplot

sns.countplot(data = 데이터프레임이름, x = "컬럼명", ax = ax'n', order = list)

parameter

  • data : dataframe
  • x : 알고자 하는 컬럼. ""로 묶어야 한다.
  • ax : 한번에 여러 그래프를 보여줄 때 자리 지정
  • order : 카테고리의 순서 결정. 컬럼에서 나올 수 있는 모든 값들이 원하는 순서로 들어가있는 리스트로 order를 설정한다.

 

회귀분석 또는 curve fitting(다항식 회귀분석) : seaborn.lmplot

sns.lmplot(data = 데이터프레임이름, x = "컬럼명", y = "컬럼명", fit_reg = True/False)

parameter

  • data : dataframe
  • x : x축이 될 컬럼. 이름을 ""로 묶어야 한다.
  • y : y축이 될 컬럼. 이름을 ""로 묶어야 한다.
  • fit_reg : 회귀선 시각화 유무 (True, False)

 

 

 

 

 

반응형