본문 바로가기
데이터 분석 및 업무 자동화

Power BI DAX TOPN 함수 사용하여 시군구별 대장 아파트 가격 비교 하기

by 공부머리 2022. 4. 22.
반응형

TOPN 함수는 POWER BI DAX 중의 하나로서, 상위 몇 개에 대한 데이터를 분석할 때 사용되는 함수입니다. TOPN 함수의 사용법을 정리해 보고 시군구별 대장 아파트의 가격을 한 번에 확인해 보도록 하겠습니다.

 

TOPN 사용법

의미 : 지정된 테이블에서 상위 N개의 행을 반환하는 함수입니다.

 

구문

TOPN(<n_value>, <table>, <orderBy_expression>, [<order>[, <orderBy_expression>, [<order>]]…])

 

  • n_value : 몇 번째 순위까지의 필터링을 할 것인지 결정하는 인수입니다.
  • table : 데이터의 테이블을 반환하는 테이블식 인수입니다. 
  • orderBy_expression : 순위를 결정할 계산 값 입니다. 
  • order(선택사항) : 정렬방법에서 0 또는 False 또는 이면 내림차순으로 정렬합니다. 내림차순이 기본값입니다. 1 또는 True 또는 ASC 이면 오름차순으로 정렬합니다.

 

반환 : 설정된 상위 N개의 행으로 이루어진 테이블을 반환합니다. N_value가 0인 경우 빈 테이블을 반환합니다. 정렬식에서 동률이면 N개보다 많은 값이 반환될 수 있습니다.

 

 

예제 (시군구별 대장 아파트 가격 비교)

로우데이터

인구수는 행안부 주민등록 인구통계를 사용했습니다. 월별시세는 국토교통부 아파트 실거래가를 다운로드하여 월간 시세 변경 등의 전처리 작업을 하였습니다.

 

측정식

먼저 월별 거래 금액의 평균을 구했습니다. SUM을 사용하지 않고 AVERAGE를 사용한 이유는 SUM을 사용하면 합계 기준으로 TOPN을 실행하기 때문에 84 면적의 평형대가 많으면 거래금액이 높아져 잘못된 결과가 나오기 때문입니다.

거래금액평균 = AVERAGE('월간시세'[거래금액])

 

다음으로 대장아파트 가격을 구하는 식입니다. 큰 맥락을 살펴보면 TOPN함수 결과 테이블을 기준으로 거래금액의 평균을 구합니다. ‘월간 시세’[key]는 시도, 시군구, 읍면동, 아파트, 평형의 문자열을 연결한 값입니다. 세부적인 맥락을 살펴보면 TOPN은 ‘월간 시세’[key] 테이블식에서 거래금액 평균이 가장 높은 1개의 테이블을 반환합니다. 시각화 시에 84 기준으로 필터링을 할 것이기 때문에 84 기준으로 가장 가격이 높은 대장 아파트의 거래금액 평균이 반환될 것입니다.

대장 아파트 가격 = 
CALCULATE([거래금액평균],
TOPN(1,ALL('월간시세'[key]),[거래금액평균])
)

 

시각화

  • 년월 슬라이서 : 월별 시세를 필터링 가능합니다.
  • 전용면적 슬라이서 : 비슷한 면적을 기준으로 필터링 하였습니다. 일반적으로 전용면적 84m2을 기준으로 비교합니다.
  • 인구수 슬라이서 : 인구수가 비슷한 지역끼리 비교 가능하도록 하였습니다.
  • 시도 슬라이서 : 수도권, 광역시, 기타지방끼리 비교하도록 하였습니다.
  • 시군구 가격 테이블 : 시군구별 인구수와 평균 거래금액, 대장 아파트의 가격이 확인 가능합니다.

분석 결과
대시보드

 

정리

각 시군구별 대장 아파트의 시세가 얼마인지 한눈에 확인 가능합니다. 또한 인구수가 비슷한 지역끼리 가격을 비교하면 어느 지역이 고평가이고 저평가인지 참고할 수 있습니다. 그 외 년월, 면적, 시도 슬라이서를 통해 내가 원하는 조건으로 비교 가능하여 편리합니다. 이상으로 TOPN 함수의 사용법과 TOPN 함수를 사용하여 시군구별 대장 아파트 가격 비교 방법에 대해서 알아보았습니다.

반응형

댓글