본문 바로가기

Data Science : Study/1. Python

Python : (pandas) DataFrame의 기본

반응형

※ 매번 비슷한 내용을 구글링하는 것에 답답해서 항목별로 정리하는 글

 

 

▶ 패키지 불러오기

import pandas as pd # 보통 애칭 많이 사용

 

▶ csv 파일 불러오기

df = pd.read_csv("파일주소")

 

▶ csv 파일 저장하기

df.to_csv('파일명.csv', encoding = 'utf-8-sig')
  • encoding 옵션 주면 한글 저장 시 깨지지 않는다.

 

빈 데이터프레임 생성하기

df = pd.DataFrame(columns = ['c1','c2','c3'])
  • 컬럼명 및 개수는 데이터프레임 생성 시 정해줘야 한다(c1, c2, c3).

 

▶ 데이터프레임 내용 미리보기 : 5개 확인가능, 괄호 안에 숫자 넣을 경우 그 수 만큼 row 출력

df.head()
  • series 사용가능

 

▶ 데이터프레임의 row, column 수 확인하기

df.shape	# (m,n) 꼴로 return

 

데이터프레임에 함수 적용하기

df2 = df.apply(func1)
  • series 사용가능

 

▶ 데이터프레임에 해당 values가 있는지 확인하고 싶어 (isin)

df.isin(values)
  • 결과는 모든 값에 대해 True/False로 나온다.
  • values는 list 가능하다. (하나의 값 아니라 여러개 가능하다는 의미. 여러개 중에 하나만 해당해도 True 인 것!)
  • True인 결과만 확인하고 싶다면 df[df.isin(values)]
  • series 사용가능

 

 

 

 

 

반응형