본문 바로가기

분류 전체보기182

MySQL 규칙 만들기 방법 - IF, CASE, CREATE FUNCTION MySQL을 공부하고 정리하고 있습니다. 오늘은 MySQL IF, CASE, CREATE FUNCTION을 사용하여 규칙 만들기에 대해서 정리해 보겠습니다. 조건을 만들어서 새로운 열을 추가하는 경우 또는 내가 직접 함수를 만들어서 사용하는 경우 규칙 만들기가 필요합니다. 조건 만들기 (IF) IF 데이터를 다루다 보면 "구매 금액 10억 이상 고객은 VVIP로 1억 이상이면 VIP로 고객 등급 뽑아주세요" "상품 매출이 1억 이상이면 0으로 미만이면 X로 데이터 뽑아주세요"와 같이 조건에 따른 값이 필요한 경우가 있습니다. 조건을 만들 때 사용하는 함수는 IF입니다. IF의 특징 IF(조건식, 참일 때 값, 거짓일 때 값) 형식으로 사용합니다. 주로 SELECT절에 사용하는 함수로, 결과 값을 새로운 .. 2022. 2. 21.
파이썬 판다스 활용한 데이터 전처리 핵심 요약 파이썬 판다스를 활용하면 데이터 전처리를 효율적으로 할 수 있습니다. 오늘은 파이썬 판다스를 활용한 데이터 전처리 기능에 대해서 정리해 보도록 하겠습니다. 결측 값 채우기 (fillna) fillna()는 na값에 대하여 fill해주는 함수입니다. 아래 코드는 누락된 데이터를 -1로 채우는 코드입니다. df['키'].fillna(-1) NaN값을 채워준 다음 유지시키려면 inplace=True 옵션을 주거나, fillna로 채워 준 값을 다시 대입해 주어야 합니다. fillna로 채워준 값을 다시 대입해 주는 방식을 추천드립니다. df2['키'].fillna(-1, inplace=True) df2['키'] = df2['키'].fillna(-1) 산술 통계의 값을 na값에 대해서도 넣어줄 수 있습니다. h.. 2022. 2. 16.
Python Pandas 핵심 요약 - pivot_table, groupby, 시각화 데이터 분석에 많이 사용되는 Python Pandas 패키지의 기능에 대해서 정리하고 있습니다. copy, row/column 추가 및 삭제, pivot_table, groupby, 시각화 등의 기능에 대해서 정리해 보겠습니다. Copy() - 복사 데이터프레임을 복사할 때 copy를 사용합니다. 오리지널 데이터프레임을 다른 이름의 변수에 넣고 수정을 하면 오리지널의 데이터프레임도 함께 수정됩니다. 어떻게 해결해야 할까요? 원본 데이터를 유지시키고, 새로운 변수에 복사할 때는 copy()를 사용해야 합니다. copy_df = df.copy() row, column 추가 row의 추가 딕셔너리 형태의 데이터를 만들어 준다음 append() 함수를 사용하여 데이터를 추가할 수 있습니다. 반드시 ignore_.. 2022. 2. 14.
파이썬 판다스 기능 핵심 요약 - 파일 읽어오기, 통계값, 색인 데이터 분석 전 전처리를 위해서 판다스를 많이 사용합니다. 오늘은 파이썬 판다스 기능들에 대해서 핵심 요약을 해보도록 하겠습니다. 파이썬 판다스란 판다스는 데이터 분석을 위한 패키지입니다. 판다스에는 막강한 기능들이 있습니다. 엑셀로 할 수 있는 모든 것, 웹 정보 수집 크롤링, 데이터베이스 핸들링, 데이터 시각화가 가능합니다. 판다스를 사용하려면 import pandas as pd 형태로 가져와서 사용하게 됩니다. Series는 1차원으로 이루어진 데이터 배열을 의미하고 DataFrame은 2차원으로 이루어진 데이터 배열을 의미합니다. 파일 읽어오기 CSV 파일, excel 파일 읽어오기 판다스에서 데이터 전처리를 하고 데이터 분석을 하려면 분석하려는 파일을 먼저 불러와야 하겠죠? 일반적으로 csv파일.. 2022. 2. 9.