반응형
※ 매번 비슷한 내용을 구글링하는 것에 답답해서 항목별로 정리하는 글
▶ 패키지 불러오기
import pandas as pd # 보통 애칭 많이 사용
▶ csv 파일 불러오기
df = pd.read_csv("파일주소")
▶ csv 파일 저장하기
df.to_csv('파일명.csv', encoding = 'utf-8-sig')
- encoding 옵션 주면 한글 저장 시 깨지지 않는다.
▶ 빈 데이터프레임 생성하기
df = pd.DataFrame(columns = ['c1','c2','c3'])
- 컬럼명 및 개수는 데이터프레임 생성 시 정해줘야 한다(c1, c2, c3).
▶ 데이터프레임 내용 미리보기 : 5개 확인가능, 괄호 안에 숫자 넣을 경우 그 수 만큼 row 출력
df.head()
- series 사용가능
▶ 데이터프레임의 row, column 수 확인하기
df.shape # (m,n) 꼴로 return
▶ 데이터프레임에 함수 적용하기
df2 = df.apply(func1)
- series 사용가능
▶ 데이터프레임에 해당 values가 있는지 확인하고 싶어 (isin)
df.isin(values)
- 결과는 모든 값에 대해 True/False로 나온다.
- values는 list 가능하다. (하나의 값 아니라 여러개 가능하다는 의미. 여러개 중에 하나만 해당해도 True 인 것!)
- True인 결과만 확인하고 싶다면 df[df.isin(values)]
- series 사용가능
반응형
'Data Science : Study > 1. Python' 카테고리의 다른 글
Python : (pandas) DataFrame 컬럼 다루기 (0) | 2020.02.28 |
---|---|
Python : (pandas) DataFrame 날짜 다루기 (0) | 2020.02.28 |
Python : 문자열(string)의 모든 것 (0) | 2020.02.28 |
Python : 조건문(if-else) (0) | 2020.02.28 |
Python : For문 (0) | 2020.02.28 |