본문 바로가기

Data Science : Project/도시문제 분석을 위한 데이터 시각화 및 탐색

PowerBI 프로젝트 : 핫플레이스 분석 - 테이블

반응형

핫플레이스 분석 프로젝트 중 내가 맡은 부분은 생활인구였다.

이 부분을 진행하면서 사용한 데이터는 다음과 같다.

  • Calendar : PowerBI에서 생성
  • 생활인구 : 공공데이터
  • 행정동코드 : 공공데이터

 

 

 1   Calendar 

 

PowerBI에서 새 테이블로 해당 데이터를 만들었다.

테이블 모드에서 테이블도구 - 새 테이블을 선택한다.

 

Calendar = ADDCOLUMNS( CALENDAR(date(2017,07,01), date(2017,12,31)), "요일", Format([Date], "aaa"), "요일No", WEEKDAY([Date], 2))

테이블의 데이터는 DAX로 작성한다: Calendar = ADDCOLUMNS( ... )

  • CALENDAR(시작날짜, 종료날짜): 연속된 날짜 세트(두 날짜 포함)가 포함된 Date라는 단일 열을 반환한다.
  • Format(, 형식): 지정된 형식에 따라 값을 텍스트로 변환한다.
    컬럼명을 쓸 때는 꼭 []로 감싼다.
    "aaa" : 요일. 보통 설명에는 "ddd"로 나온다.
  • WEEKDAY(, 형식): 날짜의 요일을 나타내는 1에서 7 사이의 숫자를 반환한다.
    형식이 2이면 한주가 월요일(1)에 시작하여 일요일(7)에 끝난다.

 

 

 

 

 


 2   생활인구  

 

  • 기준일id: 원래 데이터를 '날짜'로 변경
  • 시간대구분: 시간대별로 생활인구를 확인할 수 있도록 시간대구분 컬럼을 파워쿼리 편집기에서 추가
  • 행정동코드
  • 성별, 나이대: 원래 컬럼은 "남자0세에서10세사이"와 같은 내용. 파워쿼리 편집기에서 2개의 컬럼으로 분해.
  • 생활인구수
  • 생활인구수/24: 인구수를 24로 나눠야 우리가 원하는 "해당 시간대의 생활인구"가 나온다고 배웠는데, 이유가 기억 안 남.
  • 시간대: 측정값으로 DAX 이용하여 추가한 컬럼.

 

 

 

그리고 보고서모드에서 새 측정값으로 추가한 값들은 테이블모드에서는 나타나지 않는다.

하지만 보고서모드에서 확인할 수 있고, DAX는 다음과 같다.

 

 

 


 3   행정부코드 

생활인구테이블의 데이터와 동일해야 하기 때문에 행정동코드가 8자리인 것을 사용했다.

 

 

테이블 모드에서 위와 같이 필요한 컬럼을 추가한 후에 모델 모드에서 테이블 간 연결을 진행하였다. (다음 포스트로!)

 

 

 

 

 

반응형