이 글에서는 캐글의 Vehicle Insurance Claim Fraud Detection 데이터셋을 사용하여 보험 사기 탐지 분석을 수행하는 과정과 그에 따른 데이터 시각화 코드를 자세히 설명합니다. https://www.kaggle.com/datasets/shivamb/vehicle-claim-fraud-detection Vehicle Insurance Claim Fraud DetectionFraud detection use-case for vehicle insurance industrywww.kaggle.com 1. 라이브러리 및 데이터 불러오기import pandas as pdimport numpy as npimport seaborn as snsimport matplotlib.pyplot as ..
Data Analytics
대시보드 레이아웃바둑판식 (Tiled) / 부동식 (Floating) 바둑판식 (Tiled): 이 레이아웃 방식은 시트를 격자 형태로 정렬해 고정된 그리드 안에 배치합니다. 각 시트는 동일한 크기의 직사각형 또는 정사각형으로 배열되어, 대시보드의 레이아웃을 깔끔하고 조직적으로 유지합니다. 시트가 겹치지 않기 때문에 정돈된 구조를 선호하는 경우 유용하며, 주로 정보가 많을 때 사용됩니다. 부동식 (Floating): 부동식 레이아웃은 시트를 자유롭게 배치할 수 있어 자유로운 레이아웃을 지원합니다. 시트는 서로 겹칠 수 있으며, 크기와 위치를 개별적으로 조정할 수 있어 대시보드를 유연하게 사용할 수 있습니다. 사용자가 필요한 경우 특정 시트의 강조 또는 디자인에 따라 다양한 요소를 겹쳐 배치할 수 있어 커스..
태블로 (Tableau)란?태블로(Tableau)는 비즈니스 인텔리전스(Business Intelligence) 분야에서 가장 널리 사용되는 데이터 시각화 툴 중 하나입니다. 복잡한 데이터를 시각적으로 쉽게 표현하고 분석할 수 있는 기능을 제공하며, 비전문가도 손쉽게 다룰 수 있는 직관적인 사용자 인터페이스를 자랑합니다. 이를 통해 데이터 분석에 필요한 시간과 노력을 크게 절감할 수 있습니다.태블로는 몇 번의 클릭만으로도 다양한 그래프, 차트, 지도 및 표를 생성할 수 있어 데이터를 빠르게 파악하고 이해하는 데 도움을 줍니다. 이를 통해 데이터 간의 관계, 패턴 및 트렌드를 한눈에 파악할 수 있으며, 중요한 비즈니스 인사이트를 도출할 수 있습니다. 특히, 실시간 데이터를 반영한 시각화를 통해 의사결정에 ..
저는 이전에 파이썬과 SQL 강의를 수강하였기 때문에 배운 내용을 활용하고자 이승훈 강사님의 'SQL과 Python 연결하고 데이터분석 실습' 강의를 수강하였습니다. Python에서 MySQL 사용하기mysql.connector 는 MySQL 데이터베이스에 연결하고, SQL 쿼리를 실행하기 위한 Python 라이브러리 입니다. 파이썬 코드 내에서 직접 데이터베이스 작업을 수행할 수 있어, 데이터 분석, 웹 개발 등 다양한 애플리케이션에서 활용 가능합니다. 1. mysql-connector-python 설치# mysql driver 설치pip install mysql-connector-python# 설치 확인import mysql.connector 2. MySQL 접속 및 종료# local 에 연결c..
Day4Window 함수window함수란 select 구문에서 사용되며 분석 구간을 변동시키는 함수이며 특정 기간,구간이다. SUM, AVG, MIN, MAX, COUNT, RANK, LEAD, LAG SUM() OVER(PARTITION BY ~ ORDER BY~) order by, partition by 모두 사용했을 때 total_amount는 CUSTOMERNUMBER 기준으로 그룹화 시키고 amount의 누적합을 구하는데 paymentdate를 기준으로 오름차순 정렬해서 구하게 된다.SUM() OVER(PARTITION BY ~ ) order by를 생략했을때는 정렬의 순서가 사라지므로 partition by에 의해 그룹화된 그룹마다 누적합이 똑같아 진다. SUM() OVER(ORDER BY~)..
메타코드 M 서포터즈에 선정되었습니다. 강의 보면서 공부도 하고 포스팅 하면서 기록도 남길 수 있는 정말 좋은 기회입니다. https://www.metacodes.co.kr/ 메타코드MAI 강의 & 커뮤니티 플랫폼ㅣ300만 조회수 기록한 IT 현직자들의 교육과 함께 하세요www.metacodes.co.krDay 3HAVING GROUP BY 와 함께 사용되며, 그룹화된 결과에 조건을 적용함Where 절은 개별 테이블에 대한 조건을 적용하는 반면, Having 절은 그룹화된 결과의 집계 값에 대한 조건을 적용함. SELECT productcode, SUM(quantityordered)FROM orderdetails WHERE orderlinenumber = 1GROUP BY productcode HAVIN..