데이터 시각화를 배우는 이유
요즘 어떤 직무든 데이터를 사용하여 커뮤니케이션하는 것은 필수입니다. 가시화는 보이지 않는 것을 보이게 만드는 의미인 반면에 시각화는 시각화는 커뮤니케이션에 초점을 맞춘 단어입니다. 우리가 비즈니스에서 데이터 시각화를 하는 이유는 액션 가능한 인사이트를 찾고 커뮤니케이션하기 위해서입니다. 데이터 분석과정에서 데이터 시각화를 활용하는 부분은 가설 수립(EDA), 가설 검증(A/B Test), 모니터링(대시보드), 스토리텔링(프레젠테이션) 등으로 전 과정에서 다양하게 활용됩니다. 자신의 생각을 의미 있는 데이터 스토리텔링으로 전달할 수 있으면 조직 내에서 신뢰받고 변화를 이끄는 주체가 될 수 있습니다. 데이터 시각화를 배울 동기가 부여됩니다.
좋은 데이터 시각화 공식
데이터 시각화를 그냥 하는게 중요한 것이 아니라 데이터를 왜곡하지 않고 얼마나 정확하게 의미를 전달하는 것이 중요합니다. 첫째, 시그널은 최대화하고 노이즈는 최소화해야 합니다. 사람이 한 번에 처리할 수 있는 정보량에는 한계가 있기 때문에 정보 전달의 효율성을 생각해야 합니다. 너무 많은 대상을 표현하기보다 적은 대상을 표현하는 것이 좋은 시각화입니다. 둘째, 데이터 잉크 비율을 높여야 합니다. 표현하고자 하는 데이터 외에는 불필요한 장식을 없애고 중요한 부분만 색상 등으로 강조하여 심플하게 만들어야 합니다. 셋째, 질문에 대한 핵심 메시지가 명확한가? 에 염두에 두고 데이터 시각화를 해야 합니다. 그럼 기술적인 부분으로 들어가 구체적으로 설명을 드리겠습니다. 첫째, 3D 차트를 쓰지 않습니다. 둘째, 막대그래프의 축은 반드시 0부터 시작합니다. 이유는 차이가 과도하게 강조되어 사실을 왜곡하게 되기 때문입니다. 셋째, 꺾은선그래프의 축은 잘라내도 괜찮습니다. 트렌드를 나타내는 꺾은선 그래프의 가장 중요한 역할은 선의 기울기로 경향을 파악하는 것이기 때문입니다. 셋째, 색은 강조하고 싶은 요소에만 사용해야 합니다. 넷째, 이중축은 어느 쪽 축이 막대이고 어느 쪽 축이 선인지 불분명하여 혼란의 여지가 있기 때문에 두 개의 차트로 그리는 것이 좋습니다. 다섯째, 산포도는 가로축에 원인, 세로축에 결과를 표시해야 합니다. 산포도의 상관관계는 인과관계를 나타내지 않지만, 일반론으로 성립된다고 생각하는 경우 해석하기 쉽게 하기 위해서입니다. 여섯째, 시간 축은 가로축이 기본입니다. 시간을 가로로 배치하는 편이 경향을 인식하기 훨씬 용이하기 때문입니다.
핵심 메시지를 전달하는 법
정확하게 의미를 전달하기 위한 노하우가 있을까요? 스토리의 3단 구성을 참조하면 도움이 됩니다. 1단계, 컨텍스트 (현재 상황) 설명합니다. 2단계, 핵심 메시지 (문제와 기회)를 제시합니다. 3단계, 추천하는 액션을 제시합니다. 액션 아이템은 무엇을 해야 하는가? 왜 그것이 변해야 하는가? 어떻게 긍정적인 변화를 만들 것인가? 의 구체적인 내용을 담으면 좋습니다. 간결하면서도 핵심 메시지를 전달할 수 있겠네요. 부가적으로 핵심 메시지와 액션 아이템에 대한 득과 실(예상 변화 수치, 시간과 비용)을 추가 하면 현실감 있는 제안이 되겠습니다.
태블로(TABLEAU)를 쓰는 이유
태블로(TABLEAU)는 탄색 목적 자체가 시각화 분석을 위함입니다. 태블로의 슬로건은 데이터를 보고 이해한다입니다. 그만큼 데이터 시각화에 특화되어 있습니다. 드래그 앤 드롭, 필터링, 색상, 마크 등을 통해서 빠르고 효율적으로 데이터 시각화를 할 수 있습니다. 태블로의 장점은 여러 가지 있습니다. 첫째, 코드를 쓰지 않습니다. 드래그 앤 드롭 만으로 대시보드를 만들 수 있습니다. 둘째, 상호작용이 뛰어납니다. 특정 데이터를 클릭하면 인접 시각화 요소들이 반응합니다. 셋째, 속도가 빠릅니다. 탐색적 데이터 분석할 때 쉽고 빠르게 확인이 가능합니다. 넷째, 다양한 시각화가 가능합니다. 다른 BI 툴들은 정해진 시각화만 가능한 반면에 태블로(TABLEAU)는 X와 Y좌표만 있으면 도화지처럼 그릴 수 있습니다. 다섯째, 강력한 커뮤니티가 운영되고 있습니다. Tableau Public, MakeoverMonday 등 다양한 커뮤니티가 있어 정보를 공유하고 배울 수 있습니다.
태블로(TABLEAU) 제품군 소개
Tabluea Desktop Professional version은 유료으로 내 PC에도 저장이 가능합니다. Tabluea Desktop Public version은 무료입니다. 하지만 내가 만든 대시보드를 태블로 퍼블릭이라는 웹에 올려야만 합니다. 따라서 민감한 데이터 시각화는 적합하지 않습니다. 또한 텍스트, 엑셀, PDF, JSON 등 제한된 데이터 연결만 가능합니다. 또한 데이터 새로고침도 되지 않습니다. Tableau reader는 읽기만 가능하고 무료입니다. Tableau Server와 Tableau online은 조직 내에서 대시보드를 공유하고 권한 관리가 가능합니다.
- 데이터 전처리 : Tableau Prep
- 데이터 시각화 : Tableau Desktop (Professional version), Tableau Desktop (Public Version)
- 파일 읽기 : Tableau Reader
- 파일 업로드 : Tableau Server, Tableau Online, Tableau Public
데이터 분석 과정에서 태블로 제품군이 어떻게 쓰이는지 설명을 드리겠습니다. 1단계, 데이터 저장 단계에서 TDS 또는 TDE / HYPER라는 태블로만의 특별한 엔진으로 저장합니다. 2단계, 데이터 전처리 과정에서 TABLEAU PREP을 사용합니다. 3단계, 데이터 분석 및 시각화는 TABLEAU DESKTOP이 사용됩니다. 4단계, 데이터 공유 단계에서는 TABLEAU SERVER, TABLEAU READER, TABLUEA PUBLIC 등이 사용됩니다.
태블로(TABLEAU) 설치
학생은 학생용 무료 라이센스를 발급받아 무료로 사용할 수 있습니다. 학생용 Tableau Desktop Professional 다운로드를 하고 영문 재학증명서 등 재학을 증명할 수 있는 문서를 제출합니다. 메일로 온 링크로 태블로를 다운로드하고 태블로 상단 메뉴 도움말 > 제품 키 관리 > 메일로 온 라이선스 키 번호 입력을 하면 됩니다. 일반적으로는 Tableau Desktop professional 14일 평가판을 사용하거나 Tabluea Public 무료버전을 설치하면 됩니다. 단 개인 PC에 작업 저장이 불가능하고 반드시 Public에 업로드해야 합니다.
태블로 퍼블릭에서 대시보드 둘러보기
태블로 퍼블릭에 방문하면 전 세계 태블로 유저들이 작성한 대시보드를 확인할 수 있습니다. 다양한 분야에서 다양한 방법으로 데이터 시각화된 대시보드를 보면서 태블로의 활용 범위가 놀랍습니다. 데이터 시각화를 통하여 합리적인 의사결정을 나의 업무 분야에서도 적용하고자 하는 동기부여가 생깁니다.
태블로(TABLEAU) 공부 방법
태블로 공부 하는 방법 몇 가지 소개해 드립니다. 첫째, 태블로 공식 홈페이지 도움말, 자습서, 교육 동영상, 백과에 방문하여 둘러보시길 추천드립니다. 여기에 있는 내용만 정독해도 기본적인 태블로 기능은 마스터 가능합니다. 둘째, 무료 강의 듣기입니다. Coursera에 방문하면 여러 가지 무료 강의를 들으실 수 있습니다. 셋째, 구글에 Tableau Reference Guide라고 검색하셔서 방문하시길 추천드립니다. 블로그, 책 등 Tableau관련 참고자료의 집합체 입니다. 넷째, Make over Monday(월요일마다 태블로 대시보드를 만드는 미션 수행), Real World Fake Data(실제 비즈니스 상황 데이터 분석 미션), Workout Wednesday등에서 연습하기입니다. 다섯째, TABLEAU PUBLIC에 방문하여 맘에 드는 시각화를 즐겨찾기도 하고 다운로드하여서 어떻게 만들었는지 벤치마킹하는 것도 많은 도움이 됩니다.
이상으로 최고의 데이터 시각화 툴인 태블로(TABLEAU)에 대한 소개를 마치겠습니다. 내용 참고하시어 태블로를 본인의 업무 영역에 적용해 도전해보시길 추천드립니다. 저도 관심을 갖고 공부를 꾸준히 해보고 유용한 내용을 추가적으로 공유해보겠습니다.
'데이터 분석 및 업무 자동화' 카테고리의 다른 글
어려운 파이썬 정규식, 코딩 초보자는 이것만 익히자 (0) | 2022.03.07 |
---|---|
SQLD 자격증 살펴 보기, 나도 할 수 있다! (0) | 2022.02.24 |
MySQL 규칙 만들기 방법 - IF, CASE, CREATE FUNCTION (0) | 2022.02.21 |
파이썬 판다스 활용한 데이터 전처리 핵심 요약 (0) | 2022.02.16 |
Python Pandas 핵심 요약 - pivot_table, groupby, 시각화 (0) | 2022.02.14 |
댓글