본문 바로가기

Data Science : Project/도시문제 분석을 위한 데이터 시각화 및 탐색

Power BI: 상위행제거, 데이터 필터링, 폴더로 가져오기

반응형

 

 1   행정구역코드 

행정구역코드 데이터에는 행자부코드, 시도, 시군구, 읍면동, 행정구역명, 등록일, 말소일 열이 있다.

 

 

 

데이터 편집

엑셀의 셀 병합은 데이터를 가져오면서 전부 풀리고, 그러면서 null인 셀이 생긴다.

해당 행이 필요없다면 행 제거에서 상위행 제거를 진행한다.

 

 

 

이전과 달리 첫 행이 자동으로 열 이름으로 설정되어 있지 않다.

홈 탭 - 첫행을 머리글로 사용을 진행하여 바꿔준다.

 

 

 

필터링

데이터 중에 서울시 전체, 00구 전체 같은 데이터는 하위 열 값은 null로 되어 있다.

전체 데이터는 분석에 필요하지 않아 제거한다.

머리글 옆의 목록 버튼을 눌러 목록에서 null 값의 체크를 해제한다.

 

 

 

말소일자가 있다면 이미 없어진 주소이므로, 말소일자가 null인 것만 체크한다.

 

 

 

머리글을 직관적인 이름으로 변경해준다. (행자부코드 -> 행정동코드)

 

 

 

 

 


 2   폴더 가져오기 

csv 파일

여러 파일을 가져올 때 한 폴더 내에 있다면 한 번에 가져올 수 있다.

데이터 가져오기에서 폴더를 선택한다.

 

 

 

선택한 폴더 내에는 csv파일이 3개 들어있다.

결합에서 '결합 및 로드'를 선택한다.

 

 

 

파일 병합을 통해 3개의 csv파일을 하나로 합치고자 한다. 파일 병합 단계에서 형식을 확인한다.

 

 

 

테이블로 데이터를 확인하는데 계층구조가 제대로 설정되어 있지 않다.

의 대여일시 필드의 v를 클릭한 후, 날짜 계층으로 체크되어 있는 것을 '대여일시'로 변경한다.

 

 

 

계층이 제대로 설정된 것을 확인할 수 있다.

 

데이터 가져오기에서 폴더를 선택했기 때문에, 폴더 내의 데이터에 대해 업데이트가 생겼다면 다시 데이터 가져오기를 하지 않고 데이터의 업데이트 내용을 적용시킬 수 있다.

홈 탭의 새로고침을 클릭한다.

 

 

 

xlsx 파일

xlsx파일을 데이터 가져오기 - 폴더로 가져오고자 한다.

 

 

 

파일 병합 단계에서 xlsx 파일은 sheet가 여러 개일 수 있다고 항상 판단한다.

매개변수를 선택해야 컬럼명이 달라도 잘 병합된다.

 

 

 

xlsx파일은 가져오면 다음과 같이 나타난다.

Data 컬럼 내에 각 파일의 데이터가 들어가 있는데, table 형태라서 표시는 되지 않고 있다.

 

 

 

실제로 쓰고자 하는 Data 컬럼만 남기고 나머지 열은 삭제한다.

 

 

 

Data 내부를 확인하기 위해 '확장'이 선택된 상태에서 모든 컬럼을 선택하고 확인을 클릭한다.

 

 

 

파일이 병합되어 기존의 열 이름이 데이터부분에 들어가 있지만 잘 병합되어 가져오기가 된 것을 확인할 수 있다.

 

 

 

 

 

반응형