데이터 분석의 기본 프레임: 공간, 시간, 개체
ex) 배달음식 [공간] 자치구별 배달 주문 분포
[시간] 연중 배달 주문 추세
[개체] 시간대별 배달 주문 종류 분포
공간 데이터 시각화
1 공간데이터
- 벡터: 기하학적 형태(포인트, 라인, 폴리곤)로 표현
- 래스터: 격자형의 픽셀(cell)형태로 표현. 전문적 공간분석이 아니면 잘 활용하지 않는다.
2 좌표계
1. 지리좌표계(GCS)
- 3차원의 타원체
- 경도, 위도
- 우리나라: WGS84 또는 GRS80 타원체를 이용하여 위치표기
2. 투영좌표계
- 2차원의 평면
- 다양한 방식의 투영법이 존재
- 평면 직각 좌표계: 3차원 지구 타원체를 2차원 평면 상에 투영한 좌표계
- TM: 국내적용
- 서부원점: 북위 38도선과 동경 125도선의 교차점
- 중부원점: 북위 38도선과 동경 127도선의 교차점
- 동부원점: 북위 38도선과 동경 129도선의 교차점
- 동해원점: 북위 38도선과 동경 131도선의 교차점
- 인허가신고 데이터(www.localdata.kr): 중부원점TM 좌표계로 위치정보 제공
- TM: 국내적용
- 평면 직각 좌표계: 3차원 지구 타원체를 2차원 평면 상에 투영한 좌표계
3. 공간 데이터 파일 유형
- GeoJSON : 웹 기반의 공간 표현
- TopoJSON
4. 지오코딩(GeoCoding)
주소나 지명을 좌표(위도, 경도)로 변환하는 작업
- 무료소프트웨어(www.biz-gis.com)를 사용하여 지오코딩 가능 ← 6GB 정도여서 사용 후 지웠음!
- 서울시는 빅데이터활용시스템에서 활용(주소정제)
3 공간 경계
분포 확인이나 공간 간 비교할 때 인식해야 한다.
광역자치단체, 기초자치단체, 읍면동, 집계구
- 점밀도맵(Dot Density Map): 지도 위에 포인트 형태로
- 영역 경계 맵(Choropleth Map): 폴리곤 형태의 공간 영역에 데이터 값을 색으로 표현
- 히트맵(Heat Map): 데이터 값을 색의 농도로 표현. 대량의 위치데이터를 직관적으로
- 심볼 맵(Symbol Map): 데이터의 분포와 특정 지점 값의 크기를 시각적으로 표현
- 카토그램(Cartogram): 각 지역의 면적을 인구수에 비례하도록 변형
4 공간 데이터 시각화 실습
QGIS 위치데이터 시각화 프로그램
먼저 데이터를 로드한다.
레이어 - 레이어 추가 - 구분자로 분리된 텍스트 레이어 추가
데이터를 로드할 때 알맞게 설정해줘야 시각화가 제대로 된다!
- 파일 이름에서 파일 위치를 불러오는데 오른쪽의 버튼을 이용한다.
- 레이어 이름은 알아보기 쉽게 설정한다.
- 인코딩은 CP949를 선택한다.
- X필드, Y필드는 해당 데이터 내의 어떤 컬럼이 X, Y인지 알맞게 설정한다.
- 도형 좌표계는 기본좌표계(4326-WGS)를 선택한다.
로드된 데이터대로 지도 위에 점이 찍힌 것을 확인할 수 있다.
행정동 정보를 추가하면 위와 같이 서울 각 구의 공간경계가 표시된다.
공간 경계와 데이터를 합쳐서 의미있는 시각화를 만들고자 한다.
합칠 때는 조인을 이용하는데 벡터 - 데이터 관리도구 - 위치를 이용하여 속성을 조인을 선택한다.
- 파라미터에서 입력 레이어에 좌표추가할 때 사용한 데이터를 선택한다.
- 조인레이어는 붙이고 싶은 다른 데이터(여기서는 공간 경계)를 선택한다.
- 기하학적 조건은 within을 선택한다.
그 외에는 기본설정 그대로 놔두고 실행한다.
조인된레이어가 추가된 것을 확인할 수 있다(빨간색).
이 레이어에서 우클릭, 내보내기 - 객체를 다른이름으로 저장하면 결과를 다른 곳에서 활용 가능하다.
Power BI
파일 - 옵션 - 미리보기 기능에서 도형 맵 시각화를 선택한다.
그러면 시각화 탭에서 도형 맵 아이콘이 추가된 것을 확인할 수 있다.
도형 맵을 선택하고 아무 데이터도 추가하지 않으면 위와 같이 나타난다.
해당 데이터에는 서울시의 동 이름이 들어가 있다.
시,구,동이 들어가 있어 위도, 경도가 없어도 매핑이 잘 되지만 중구의 한 동이 제대로 안 돼서 엉뚱한 곳에 점이 찍힌다.
이 문제를 위도, 경도 없이 해결하기 위해
모델링 탭에서 홈 테이블에서 데이터 범주를 구/군으로 맞춰주면 제대로 시각화된다.
'Data Science : Project > 도시문제 분석을 위한 데이터 시각화 및 탐색' 카테고리의 다른 글
PowerBI 프로젝트 : 핫플레이스 분석 - 모델 (0) | 2020.05.11 |
---|---|
PowerBI 프로젝트 : 핫플레이스 분석 - 테이블 (0) | 2020.05.10 |
Power BI: 날짜 데이터타입, 열 피벗 해제, 다중데이터 분할 (0) | 2020.01.20 |
Power BI: 상위행제거, 데이터 필터링, 폴더로 가져오기 (0) | 2020.01.20 |
Power BI: 카드, 묶은 가로 막대형 차트, 꺾은선형 차트, 슬라이서, 맵, 테이블 (0) | 2019.12.18 |