본문 바로가기

Data Science : Project/도시문제 분석을 위한 데이터 시각화 및 탐색

PowerBI 프로젝트 : 보고서 - 구 단위 2 시각화4 꺾은선형 차트 1) 월별 생활인구 날짜 계층을 바꾸면 분기, 년도 별로도 확인이 가능하나 유의미한 상태가 월별이라고 판단하여 월로 고정하였다. 월별 서울시 구의 생활인구는 위와 같고, 마포구, 강남구, 서초구의 생활인구가 많음을 알 수 있다. 필드 축: (Calendar) Date, 월, 일 테이블 내에는 Date 컬럼만 있는데, 그걸 필드-축으로 끌고 오면 v 표시가 생긴다. 해당 표시를 클릭하여 날짜 계층을 선택하면 월, 일이 생긴다. 범례: (행정동코드) 시군구명 - 색을 임의로 지정할 수 없고, 범례에 따라 무작위로 선택된다. 다른 시각화 개체를 생성하면 같은 범례값끼리는 같은 색으로 나온다. 값: (생활인구) 평균생활인구수/24개 생활인구 테이블 내에 생활인구수/24 컬럼 생성: 생활인.. 더보기
PowerBI 프로젝트 : 보고서 - 구 단위 1 핫플레이스 분석의 목표는, 시각화를 통해 핫플레이스가 어디인지 분석해내는 것이다. 이를 위해 핫플레이스의 정의를 정하였고, 정한 정의에 따라 시각화를 진행하였다. 우리가 정한 핫플레이스란? 젊은 사람들이 많이 돌아다니고, 핫한 가게가 많은 곳! 이 중 내가 맡은 부분은 생활인구 데이터로, 젊은 나이의 유동인구가 많은 곳이 핫플레이스라고 가정하고 시각화를 진행하였다. Option 필터 생활인구 데이터 중 2030대의 데이터만 필터를 걸어 시각화에 사용한다. 이를 통해 젊은 사람들이 많이 다니는 곳을 알 수 있다. 현재 페이지에서만 필터를 걸건지, 모든 페이지에 필터를 건건지에 따라 필터를 선택한다. - 데이터 필드 추가로 원하는 컬럼을 추가한다. - 필터 형식을 선택한다 : 여기서는 '기본 필터링'을 선택.. 더보기
PowerBI 프로젝트 : 핫플레이스 분석 - 모델 모델 모드에서 테이블 간 연결을 진행하는데, 의미가 같은 컬럼끼리 연결해준다. 원하는 컬럼을 클릭한 채 드래그해서 다른 테이블의 컬럼에서 클릭을 놓으면 연결이 된다. 연결을 했는데 이미지와 같이 양방향이 아닐 경우, 화살표 위에서 오른쪽 클릭으로 속성에 들어가 설정을 변경해준다. 생활인구 [행정동코드] = 행정동코드 [행자부행정동코드] 생활인구 [기준일ID] = Calendar [Date] 이제 이 테이블을 이용하여 시각화를 진행하였다. (다음 포스트로) 더보기
PowerBI 프로젝트 : 핫플레이스 분석 - 테이블 핫플레이스 분석 프로젝트 중 내가 맡은 부분은 생활인구였다. 이 부분을 진행하면서 사용한 데이터는 다음과 같다. Calendar : PowerBI에서 생성 생활인구 : 공공데이터 행정동코드 : 공공데이터 1 Calendar PowerBI에서 새 테이블로 해당 데이터를 만들었다. 테이블 모드에서 테이블도구 - 새 테이블을 선택한다. Calendar = ADDCOLUMNS( CALENDAR(date(2017,07,01), date(2017,12,31)), "요일", Format([Date], "aaa"), "요일No", WEEKDAY([Date], 2)) 테이블의 데이터는 DAX로 작성한다: Calendar = ADDCOLUMNS( ... ) CALENDAR(시작날짜, 종료날짜): 연속된 날짜 세트(두 날짜.. 더보기
QGIS, Power BI: 공간데이터 시각화 데이터 분석의 기본 프레임: 공간, 시간, 개체 ex) 배달음식 [공간] 자치구별 배달 주문 분포 [시간] 연중 배달 주문 추세 [개체] 시간대별 배달 주문 종류 분포 공간 데이터 시각화 1 공간데이터 벡터: 기하학적 형태(포인트, 라인, 폴리곤)로 표현 래스터: 격자형의 픽셀(cell)형태로 표현. 전문적 공간분석이 아니면 잘 활용하지 않는다. 2 좌표계 1. 지리좌표계(GCS) 3차원의 타원체 경도, 위도 우리나라: WGS84 또는 GRS80 타원체를 이용하여 위치표기 2. 투영좌표계 2차원의 평면 다양한 방식의 투영법이 존재 평면 직각 좌표계: 3차원 지구 타원체를 2차원 평면 상에 투영한 좌표계 TM: 국내적용 서부원점: 북위 38도선과 동경 125도선의 교차점 중부원점: 북위 38도선과 동경 1.. 더보기
Power BI: 날짜 데이터타입, 열 피벗 해제, 다중데이터 분할 1 데이터 로드 생활인구수 데이터 중 2019년 9월의 데이터를 사용하였다. 머리글에 한글이 있으므로 파일원본에서 유니코드로 설정한다. 2 데이터 편집 필요없는 열 제거 연산을 통해 구할 수 있는 열은 제거하려고 한다. 총생활인구수 열을 제거하였다. 데이터 타입 수정: 날짜 데이터 타입을 수정한다. 기준일ID이므로 날짜로 수정해준다. 그러면 위와 같이 오류가 발생한다. 왜? 숫자에서 날짜 형태로 넘어가는 것을 Power BI가 인식하지 못한다. 먼저 데이터 타입을 텍스트로 수정한다. 그 이후에 날짜로 수정하면 이 경우 이전에 타입 변경을 한 번 했기 때문에 위와 같은 메시지가 뜨는데 이 때 새 단계 추가를 한다. 아니면 데이터 타입을 텍스트로 바꿨던 기록이 없어지기 때문에 아까와 같은 오류가 발생한다. .. 더보기
Power BI: 상위행제거, 데이터 필터링, 폴더로 가져오기 1 행정구역코드 행정구역코드 데이터에는 행자부코드, 시도, 시군구, 읍면동, 행정구역명, 등록일, 말소일 열이 있다. 데이터 편집 엑셀의 셀 병합은 데이터를 가져오면서 전부 풀리고, 그러면서 null인 셀이 생긴다. 해당 행이 필요없다면 행 제거에서 상위행 제거를 진행한다. 이전과 달리 첫 행이 자동으로 열 이름으로 설정되어 있지 않다. 홈 탭 - 첫행을 머리글로 사용을 진행하여 바꿔준다. 필터링 데이터 중에 서울시 전체, 00구 전체 같은 데이터는 하위 열 값은 null로 되어 있다. 전체 데이터는 분석에 필요하지 않아 제거한다. 머리글 옆의 목록 버튼을 눌러 목록에서 null 값의 체크를 해제한다. 말소일자가 있다면 이미 없어진 주소이므로, 말소일자가 null인 것만 체크한다. 머리글을 직관적인 이름.. 더보기
Power BI: 카드, 묶은 가로 막대형 차트, 꺾은선형 차트, 슬라이서, 맵, 테이블 카드 카드형은 필드가 1개여서 1개만 어떤 값을 넣을지 결정하면 된다. 시각화 창에 나온 결과를 확인. 현재 시각화 창에 나온 숫자는 대여소번호의 개수를 센 것이다. 필드의 오른쪽의 v 표시 된 부분을 클릭하면 필드의 개수를 셀 건지, 합계를 낼 건지 등을 선택할 수 있다. 서식을 수정해서 카드를 더 예쁘게 만들 수 있다. 빨간 네모를 클릭하면 서식으로 바뀐다. 제목을 넣어보자. 위와 같이 색을 수정했다면 한글 글씨가 짤리게 된다. 원래 설정되어있던 글꼴에서 Arial Black으로 바꿔주면 글씨가 짤리지 않는다. 필요한 만큼 카드를 추가해주었다. 서식복사를 이용하여 쉽게 서식을 통일할 수 있다. 묶은 가로 막대형 차트 서식에서 x, y축과 제목을 없애고 데이터 레이블을 걸어서 막대에 값을 표시하게끔 해.. 더보기