4일차 과제
[Day4]
도시대기 미세먼지 데이터와 빅맥 지수 데이터를 이용하여 다양한 시각화를 이용해 “시간 분석”을 해봅니다.
보통 시간 관련된 분석을 할 때는 트렌드를 살펴보는데 유용한 라인차트를 자주 사용하는데요.
라인차트 이외에도 시간과 관련된 데이터를 분석하는 시각화는 다양합니다. 아래 과제를 통해서 한 번 살펴볼까요?
아래 워크북을 다운로드 받으세요.(최신 버전 다운로드를 권장합니다.)
V2020.1 이상 : DAY4 Time Analysis_Start.twbx
V2018.1 : DAY4 Time Analysis_Start_v2018.1.twbx
4일차 과제 내용
1. 라인 차트
2. 하이라이트 테이블
3. 테이블 계산식을 이용한 시간 분석
4. 덤벨차트
1. 라인 차트
라인 차트는 시간의 흐름에 따라 데이터의 패턴과 트렌드를 보는데 가장 많이 사용되는 시각화 입니다.
라인차트를 이용해서 아래와 같이 월 별 미세먼지 평균 지수를 한 번 살펴볼까요 ?
사용 Data : 도시대기 미세먼지(PM10)
[시각화를 위한 HINT]
1. 기준년월을 열 선반에 놓아주세요.
태블로에서는 날짜 필드를 시각화에 가져다 놓으면 기본적으로 “년”을 기준으로 보여집니다.
이를 “월”로 변경해주세요. 가져다 놓은 기준년월에서 마우스 오른쪽 버튼을 클릭하고 “월”을 선택해주시면 됩니다
2. PM10의 집계 형태는 평균으로 변경해주세요.
아래 그림처럼, 2010년부터 2019년까지의 데이터를 가지고 각 월 별로 평균 PM10이 나타내진 것을 알 수가 있습니다. 확실히 겨울철에 미세먼지가 심한 것을 확인할 수가 있네요.
3. 위의 시각화처럼 월로 평균 값을 보는 것이 아니라, 2010년도부터 2019년까지의 월 별로 미세먼지가 어떻게 변화했는지
추이를 살펴보고 싶다면 어떻게 해야 할까요?
이번에는 기준년월 알약에서 마우스 오른쪽 버튼을 누르고, 아래 쪽에 있는 월을 선택해보세요.
그럼 이전과는 다르게 시간이 월을 기준으로 연속적으로 표시되는 것을 볼 수 있습니다.
이처럼 날짜의 옵션을 위쪽(불연속형)을 선택하느냐 아래쪽 (연속형)을 선택하느냐에 따라서 시간 표현을 다르게 할 수 있습니다. 이 내용은 2주차에 좀 더 자세히 다루니 이런 느낌이구나 정도로 느끼고 지나가시면 좋을 것 같아요~
다음으로 시도 별로 월 별 미세먼지 변화량을 한 번 살펴볼까요? 어떻게 시각화를 해보시겠어요?
한 번 자유롭게 고민해 보시고 다음 과제로 넘어 가볼까요?
2. 하이라이트 테이블
하이라이트 테이블을 이용하여 텍스트에 색상을 추가로 표현하면 여러 값의 패턴을 좀 더 명확하게 볼 수 있습니다.
시도 별 월 별 미세먼지 패턴을 좀 더 명확하게 살펴봅니다.
사용 Data : 도시대기 미세먼지(PM10)
[시각화를 위한 HINT]
1. “기준년월”의 “월”을 열 선반에 놓아주세요.
- Window : 기준년월에서 마우스 오른쪽 버튼을 클릭하고 열 선반으로 드래그
- MAC : Option 키를 누르고 기준년월을 열 선반으로 드래그
위쪽에 있는 (불연속형) “월”을 선택해 주세요.
2. “시도”를 행 선반에 놓아주세요.
3. 마크의 모양은 사각형을 선택해 줍니다.
4. 마크의 색상을 평균 PM10 수치로 표현해보세요.
미세먼지가 높을 수록 붉은색으로 미세먼지가 낮을수록 파란색으로 표현해주세요
3. 테이블 계산식을 이용한 시간 분석
빅맥 지수는 각 나라의 물가, 구매력 평가를 비교하기 위해 고안된 경제지표 입니다. 나라 별 빅맥 가격을 달러로 환산하고 이를 비교하면 나라 별 물가를 비교할 수 있습니다.
big-mac-raw-index 데이터에 있는 Dollar Price는 달러로 환산된 빅맥 가격입니다.
Dollar Price를 이용해서 2000년도 대비 2020년도의 빅맥 가격이 국가별로 얼마나 상승했는지 비교해보려고 하는데요.
그런데 여기서 잠깐!!
빅맥 가격 상승 폭을 비교할 때 단순히 가격으로 비교하는 것이 아니라 가격 상승 비율을 통해서 어느 나라 빅맥 가격이 가장 큰 폭으로 상승했는지 살펴봅시다!
예를 들어, A국가에서는 2000년도에는 500원 이던 빅맥이 1000원으로 올랐다면 100% 증가, B국가에서는 1600원 이었던 것이 2000원으로 올랐다면 25% 증가했겠죠. 그렇다면 A국가의 빅맥 가격이 작더라도 A국가는 더 많은 가격이 상승한 것을 볼 수 있을텐데요. 이와 같은 기준으로 아래와 같이 시각화를 나타내볼까요?
사용 Data = big-mac-raw-index
시각화 후 아래 질문에 답해 보세요!
Q : 어느 나라 빅맥 가격 변동 비율이 가장 큰가요?
[시각화를 위한 HINT]
1. Date 필드를 열에 가져다 놓은 후 2000년도와 2020년 값만 유지하세요.
Ctrl 키를 이용해서 2000년 마크와 2020년 마크를 선택하고 “이 항목만 유지”를 써보시는 것도 좋을 거 같네요.
2. Dollar Price에 대해 “퀵 테이블 계산” 중 “비율 차이”를 사용해 보세요.
값이 제대로 나오지 않는 것 같다면 3번을 고려해 주세요!
3. “테이블 계산 편집”을 이용해서 테이블 계산식의 기준을 변경해 보세요. (2000년은 데이터의 가장 “첫 번째” 값입니다. )
4. 덤벨차트
덤벨차트를 이용해서 연도 별로 최소 빅맥 가격과 최대 빅맥 가격의 차이 변화를 한 눈에 살펴봅니다. Korea_Price를 이용해서 한국의 빅맥 가격 변동도 함께 살펴보면 더 좋을 것 같네요. (*Korea_Price는 어떻게 계산했는지 편집 버튼을 이용하셔서 살펴보세요)
사용 Data = big-mac-raw-index
[시각화를 위한 HINT]
1. “행”에 “년월” 기준으로 알약을 가져다 놓으세요.
마우스 오른쪽 버튼을 클릭한 채로 Date를 행에 가져다 놓으시고, (불연속형) "년월"을 선택하시면 되겠죠?
2. 여러 개의 측정값을 하나의 축에 표현하기 위해서는 “측정값”을 이용해야 합니다. (측정값 및 측정값 이름 도움만 문서 통해 두 개념은 알고 계실 것이라 생각합니다!!)
“열”에 “측정값”을 가져다 놓고 , “측정값 이름”을 필터로 걸어 “Dollar Price”와 “Korea_Price”만 체크해 주세요.
3. 측정값 선반에 있는 “Dollar Price”의 집계 형식을 “최소값”으로 변경해서 빅맥 최소 금액을 찾아 보세요.
(선반에 있는 Dollar Price에서 마우스 오른쪽 버튼을 클릭해서 변경하면 됩니다.)
4. 측정값 선반에 “Dollar Price”를 한 번 더 가져다 놓고 집계 형식을 “최대값”으로 변경해서 빅맥 최대 금액을 찾아 보세요.
(측정값 선반에 최소값(Dollar Price), 합계(Korea_Price), 최대(Dollar Price)가 제대로 들어갔나요?)
5. 마크의 형태를 “원”으로 표현하고, 마크의 색상은 “측정값 이름”으로 구분해 봅니다.
6. 열에 있는 “측정값”을 옆으로 복사해서 2개의 측정값이 보이도록 만들어 보세요.
Ctrl키를 누르고 측정값을 클릭한 상태로 그 옆으로 드래그 해보세요~
7. 복사된 측정값의 마크 형태는 “라인”으로 변경하세요. 색상에 있는 “측정값 이름”을 “경로”로 옮겨보세요.
8. 2개의 축을 이중축으로 만들어 보세요. 이중축 후 축을 동기화 시켜 주세요.
9. 선이 위로 올라오나요? 열에 있는 2개의 측정값 위치를 서로 바꿔보세요~
'개인 프로젝트 > 데이터 분석 프로젝트' 카테고리의 다른 글
[통계] SAS Certified Advanced Programmer (0) | 2025.01.31 |
---|---|
[Tableau] BI 신병훈련 5일차 과제 (0) | 2025.01.20 |
[Tableau] BI 신병훈련 3일차 과제 (0) | 2025.01.19 |
[데이터사이언스] 선형대수학 개념 정리 (0) | 2025.01.19 |
[Tableau] BI 신병훈련 2일차 과제 (0) | 2025.01.18 |
댓글