데이터 분석 및 업무 자동화67 태블로(TABLEAU) 소개, 최고의 데이터시각화 툴 데이터 시각화를 배우는 이유 요즘 어떤 직무든 데이터를 사용하여 커뮤니케이션하는 것은 필수입니다. 가시화는 보이지 않는 것을 보이게 만드는 의미인 반면에 시각화는 시각화는 커뮤니케이션에 초점을 맞춘 단어입니다. 우리가 비즈니스에서 데이터 시각화를 하는 이유는 액션 가능한 인사이트를 찾고 커뮤니케이션하기 위해서입니다. 데이터 분석과정에서 데이터 시각화를 활용하는 부분은 가설 수립(EDA), 가설 검증(A/B Test), 모니터링(대시보드), 스토리텔링(프레젠테이션) 등으로 전 과정에서 다양하게 활용됩니다. 자신의 생각을 의미 있는 데이터 스토리텔링으로 전달할 수 있으면 조직 내에서 신뢰받고 변화를 이끄는 주체가 될 수 있습니다. 데이터 시각화를 배울 동기가 부여됩니다. 좋은 데이터 시각화 공식 데이터 시각.. 2022. 2. 23. MySQL 규칙 만들기 방법 - IF, CASE, CREATE FUNCTION MySQL을 공부하고 정리하고 있습니다. 오늘은 MySQL IF, CASE, CREATE FUNCTION을 사용하여 규칙 만들기에 대해서 정리해 보겠습니다. 조건을 만들어서 새로운 열을 추가하는 경우 또는 내가 직접 함수를 만들어서 사용하는 경우 규칙 만들기가 필요합니다. 조건 만들기 (IF) IF 데이터를 다루다 보면 "구매 금액 10억 이상 고객은 VVIP로 1억 이상이면 VIP로 고객 등급 뽑아주세요" "상품 매출이 1억 이상이면 0으로 미만이면 X로 데이터 뽑아주세요"와 같이 조건에 따른 값이 필요한 경우가 있습니다. 조건을 만들 때 사용하는 함수는 IF입니다. IF의 특징 IF(조건식, 참일 때 값, 거짓일 때 값) 형식으로 사용합니다. 주로 SELECT절에 사용하는 함수로, 결과 값을 새로운 .. 2022. 2. 21. 파이썬 판다스 활용한 데이터 전처리 핵심 요약 파이썬 판다스를 활용하면 데이터 전처리를 효율적으로 할 수 있습니다. 오늘은 파이썬 판다스를 활용한 데이터 전처리 기능에 대해서 정리해 보도록 하겠습니다. 결측 값 채우기 (fillna) fillna()는 na값에 대하여 fill해주는 함수입니다. 아래 코드는 누락된 데이터를 -1로 채우는 코드입니다. df['키'].fillna(-1) NaN값을 채워준 다음 유지시키려면 inplace=True 옵션을 주거나, fillna로 채워 준 값을 다시 대입해 주어야 합니다. fillna로 채워준 값을 다시 대입해 주는 방식을 추천드립니다. df2['키'].fillna(-1, inplace=True) df2['키'] = df2['키'].fillna(-1) 산술 통계의 값을 na값에 대해서도 넣어줄 수 있습니다. h.. 2022. 2. 16. Python Pandas 핵심 요약 - pivot_table, groupby, 시각화 데이터 분석에 많이 사용되는 Python Pandas 패키지의 기능에 대해서 정리하고 있습니다. copy, row/column 추가 및 삭제, pivot_table, groupby, 시각화 등의 기능에 대해서 정리해 보겠습니다. Copy() - 복사 데이터프레임을 복사할 때 copy를 사용합니다. 오리지널 데이터프레임을 다른 이름의 변수에 넣고 수정을 하면 오리지널의 데이터프레임도 함께 수정됩니다. 어떻게 해결해야 할까요? 원본 데이터를 유지시키고, 새로운 변수에 복사할 때는 copy()를 사용해야 합니다. copy_df = df.copy() row, column 추가 row의 추가 딕셔너리 형태의 데이터를 만들어 준다음 append() 함수를 사용하여 데이터를 추가할 수 있습니다. 반드시 ignore_.. 2022. 2. 14. 이전 1 ··· 10 11 12 13 14 15 16 17 다음