KB 부동산 주간 시계열에 매수 우위 지수와 매매 증감률 데이터가 제공됩니다. 파워 비아이를 활용하여 두 데이터의 상관관계를 분석하겠습니다. 상관관계를 시각화하고 상관계수로 계량화하는 방법을 살펴보겠습니다.
상관분석의 이해
상관분석은 두 변수 간의 선형적 관계를 분석하는 방법입니다. 두 변수는 서로 독립적이거나 상관된 관계일 수 있습니다. 일상생활에서 상관관계가 있는 지표들은 무엇이 있을까요? 키가 크면 몸무게가 커집니다. 겨울에 기온이 낮으면 맑은 하늘이 보이고 기온이 올라가면 미세먼지가 몰려오곤 합니다. 몸무게와 키의 관계, 기온과 미세먼지 농도와의 관계에는 상관관계가 있다고 볼 수 있습니다. 상관관계를 정량화할 수 있을까요? 상관관계의 정도를 상관계수를 통해 정량화할 수 있습니다. 일반적으로 상관계수에 따른 상관관계는 아래 표와 같이 정리할 수 있습니다.
상관계수 | 상관관계 |
+/- 0.9 이상 | 상관관계가 아주 높다 |
+/- 0.7~0.9 | 상관관계가 높다 |
+/- 0.4~0.7 | 상관관계가 있다 |
+/- 0.2~0.4 | 상관관계가 있으나 낮다 |
+/- 0.2 미만 | 상관관계가 거의 없다 |
매수 우위 지수와 매매 증감률 상관관계 분석 배경
매주 금요일 발표되는 KB 주간 동향에는 매수 우위 지수와 매매 증감률 데이터가 제공됩니다. 매수 우위 지수는 매수자가 많은지 매도자가 많은지를 바탕으로 구한 부동산 심리를 나타내는 지표입니다. 매매 증감률은 매매 지수가 전주 대비 얼마나 변동했는지 나타내는 지표입니다. 주기적으로 데이터를 확인하다 보면 매매 심리 지수가 높아지면 매매 증감률도 높아지는 느낌을 받습니다. 두 데이터 간에는 상관관계가 높아 보이는 생각이 듭니다. 상관계수를 구해서 수치적으로 확인하고 싶어서 분석하게 되었습니다. 상관계수는 파워 비아이를 통하여 쉽게 구할 수 있습니다.
파워 비아이에서 상관계수 구하는 방법
파워 비아이에서 빠른 측정값을 활용하면 쉽게 상관계수를 구할 수 있습니다. 빠른 측정값은 두 가지 방법으로 접근 가능합니다.
- [홈] - [계산] - [빠른 측정값]
- [필드] - [마우스 우클릭] - [빠른 측정값]
빠른 측정값을 선택하면 아래 그림과 같은 화면이 나옵니다. 범주는 상관관계를 찾으려는 범주를 의미합니다. 측정값 X는 상관관계를 찾으려는 첫 번째 측정값을 의미합니다. 측정값 Y는 상관관계를 찾으려는 두 번째 측정값을 의미합니다.
저는 기간에 따라서 경기도의 매수우위 지수와 매매 증감률을 보려고 다음과 같이 설정하였습니다. 다른 데이터를 활용하실 때는 범주와 측정값 X와 측정값 Y를 목적에 따라 바꿔주시면 됩니다.
- 계산 탭에서 상관 계수를 선택합니다.
- 범주에서는 년월을 선택합니다.
- 측정값 X는 매수우위 지수를 선택한 후 평균으로 설정합니다.
- 측정값 Y는 매매 증감률을 선택한 후 평균으로 설정합니다.
대시보드 구현
상관계수를 구하고 결과를 쉽게 확인하기 위해서 시각화를 해보았습니다.
- 슬라이서 : 슬라이서를 추가하여 기간을 설정할 수 있도록 했습니다. 날짜를 변경하면 다른 시각화 요소가 변경이 됩니다.
- 카드 : 카드 안에 상관계수를 넣어 값을 확인할 수 있도록 했습니다. 상관 계수가 0.86이면 상관관계가 높다고 볼 수 있습니다.
- 꺾은선 막대 차트 : 매수우위 지수를 꺾은선 차트로 매매 증감률을 막대 차트로 표현했습니다. 매수우위 지수와 매매 증감률의 상관관계가 높은 것이 시각적으로 보입니다.
- 산포도 : 매수우위지수를 X축, 매매 증감률을 Y축으로 설정하여 산포도를 그려보았습니다. 매수우위 지수가 높을수록 매매 증감률이 높고 매수우위 지수가 낮을수록 매매 증감률이 낮아지는 경향을 보입니다.
정리 소감
매수우위 지수와 매매 증감률이 어느 정도 상관관계가 있다고 느꼈지만 상관계수를 통해서 수치화하니 보다 명확해졌습니다. 또한 파워 비아이를 통해서 상관계수를 쉽게 구하고 시각화할 수 있다는 점에서 파워 비아이의 효용성을 느꼈습니다. 매수심리지수는 시도별로 데이터가 제공되는 반면 매매 증감률은 시군구까지 데이터가 제공이 됩니다. 따라서 시도 매수우위 지수와 시군구별 매매증감률의 상관계수를 구하면 어느 시군구가 시도 매수우위지수와 연관성이 높은지 파악할 수 있을 것 같습니다.
'데이터 분석 및 업무 자동화' 카테고리의 다른 글
Power BI 필터 컨텍스트와 행 컨텍스트 살펴보기 (0) | 2022.03.22 |
---|---|
KB 부동산 월간 시계열 매매종합 시트 파이썬 판다스 불러오기 (0) | 2022.03.21 |
Power BI 시간 인텔리전스 사용을 위한 날짜 테이블 만들기 (CALENDAR, CALENDARAUTO) (0) | 2022.03.18 |
MySQL 테이블 합치는 방법 살펴보기 (JOIN) (0) | 2022.03.17 |
POWER BI 입문 추천 책 리뷰 <데이터 시각화와 탐색 WITH POWER BI> (1) | 2022.03.12 |
댓글