Data Analysis 4

서울시 상권매출 데이터 다중회귀분석/군집분석 프로젝트

사실 이건 수업에서 프로젝트로 해볼 예정이었는데 엎어지는 바람에 제가 진행해본 부분만을 정리하려 합니다. 그렇기에 부족한 부분이 있을 수 있다는 점을 감안해주시면 감사하겠습니다. 😊 https://data.seoul.go.kr/dataList/OA-15572/S/1/datasetView.do 데이터는 서울시 열린 데이터 광장에서 가져왔습니다. 서울시 우리 마을가게 상권분석 서비스(상권-추정 매출) 데이터이며, 2021년 데이터만 가져왔습니다. 요일별, 시간대별, 연령대 등등 세부적으로 매출을 확인할 수 있습니다. 저는 이러한 세부적인 매출을 통해 총매출을 예측하는 다중회귀모델을 찾아내고, 업종을 3가지로 구분해 각 업종별로 군집분석을 하는 것을 큰 주제로 정하려 합니다. import numpy as np..

Data Analysis 2022.04.01

RFM과 K-means 이용한 고객 데이터 분석 프로젝트 (with Kaggle 데이터)

예전에 RFM 등급을 통해 고객 데이터를 분석해봤었는데 새로운 고객 분석 기법을 알기도 했고 제가 고객 분석하는 것을 제일 좋아하기에 재미있게 진행했던 기억이 있었습니다. 그래서 다른 데이터에도 RFM 분석을 적용해보고 싶어 이번 프로젝트를 준비해보았습니다. https://www.kaggle.com/olistbr/brazilian-ecommerce Brazilian E-Commerce Public Dataset by Olist 100,000 Orders with product, customer and reviews info www.kaggle.com 캐글의 Brazilian E-coomerce Public 데이터를 이용해 고객 데이터 분석을 해보았습니다. 8개의 데이터가 있고 각 데이터들은 고유키를 기준..

Data Analysis 2022.03.16

파이썬 단어 간 상관관계 분석해보기

이걸 연관성 분석이라 불러도 될지 모르겠지만.. 단어 상관관계 분석을 해보겠습니다. 제가 사용한 데이터는 캐글의 넷플릭스 데이터입니다. Netflix Movies and TV Shows Listings of movies and tv shows on Netflix - Regularly Updated www.kaggle.com 이 데이터는 넷플릭스에 존재하는 프로그램들의 특징을 나타낸 것입니다. 그렇기에 프로그램이 어떤 장르인지 나타내는 컬럼이 있으며 , 한 프로그램 당 여러 개의 장르가 있는 경우가 많습니다. 예를 들어 8804행을 보면 해당 프로그램은 장르가 코미디이면서 스릴러 무비인 프로그램인 것입니다. 어떤 장르들끼리 묶여있는 경우가 많은지 보기 위해 상관관계를 살펴보기로 하였습니다. 위 값들을 아래..

Data Analysis 2022.02.27

코멘토 직무부트캠프 후기-데이터분석 실무자와 빅데이터 인프라부터 데이터 분석 경험하기

여름방학도 슬슬 끝나가고 그동안 했던 활동도 마무리돼가는 중이라 이제 어떤 공부를 해야 할까 고민하던 참에 우연히 코멘토 직무부트캠프를 발견하게 되었다. 아마 광고를 통해 알게 되었던 것 같은데.. 평소에 광고가 뜨면 그냥 넘기는 편인데 이건 왠지 모르게 궁금해서 이것저것 찾아보았다. ​https://comento.kr/edu/learn/ITSW/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-G381 데이터분석 실무자와 빅데이터 인프라부터 데이터 분석 경험하기 | 코멘토 직무부트캠프 [ 차시 별 과제 소개 ]첫번째 과제참여자분들이 실제 데이터 분석업무로 실무에 투입될 경우, 가장 먼저 그리고 가장 많이 수행하는 대표적인 작업 중 하나인 데이터 탐색 작업입니다. comento.kr 내가..

Data Analysis 2021.10.26
반응형