분류 전체보기 33

리트코드(LeetCode) MySQL-Consecutive Numbers

1️⃣ JOIN으로 풀기 SELECT DISTINCT l1.num as ConsecutiveNums FROM Logs as l1 INNER JOIN Logs as l2 ON l1.id +1= l2.id INNER JOIN Logs as l3 ON l2.id +1= l3.id WHERE l1.num=l2.num AND l1.num=l3.num 1. DISTINCT를 붙이는 이유 : 동일한 숫자가 4번 나올 경우 두 개의 아이디에서 조건이 성립된다. 이 경우 같은 숫자가 2번 나올 수 있기에 DISTINCT를 넣는다. 2. WHERE 조건 2번 쓰기 처음에 l1.num=l2.num=l3.num으로 썼는데 , Run Code에서는 되고, Submit에서는 에러가 떴다. 이렇게 쓰면 비교가 안되는건가...? 어..

SQL 2022.08.09

SQL - 행별로 다른 누적합을 구하고 싶다면

셀프 조인을 하면 된다. 예를 들어 해당 날짜로부터 3일 전~해당날짜에 있는 컬럼의 금액들을 모두 합하고 싶다면 SELECT r1.order_date, SUM(r2.cost) as sum_3day FROM records as r1 LEFT JOIN records as r2 ON r1.order_date BETWEEN DATE_ADD(r2.order_date, INTERVAL -3 DAY) AND r2.order_date GROUP BY r1.order_date 이런 식으로 해주면 될 듯하다. 셀프조인으로 풀 생각은 안해본 나를 반성한다.

SQL 2022.08.08

해커랭크(HackerRank) MySQL-Top Earners

SELECT * FROM ( select salary*months as earning, count(salary*months) as counting from Employee GROUP BY earning ) as salary order by earning desc limit 1 처음엔 이렇게 풀었다. 답은 나오지만 더 효율적인 코드는 select salary*months as earning, count(salary*months) from Employee where salary*months=(select max(salary*months) from Employee) group by earning select salary*months as earning, count(salary*months) from Emplo..

SQL 2022.08.05

서울시 상권매출 데이터 다중회귀분석/군집분석 프로젝트

사실 이건 수업에서 프로젝트로 해볼 예정이었는데 엎어지는 바람에 제가 진행해본 부분만을 정리하려 합니다. 그렇기에 부족한 부분이 있을 수 있다는 점을 감안해주시면 감사하겠습니다. 😊 https://data.seoul.go.kr/dataList/OA-15572/S/1/datasetView.do 데이터는 서울시 열린 데이터 광장에서 가져왔습니다. 서울시 우리 마을가게 상권분석 서비스(상권-추정 매출) 데이터이며, 2021년 데이터만 가져왔습니다. 요일별, 시간대별, 연령대 등등 세부적으로 매출을 확인할 수 있습니다. 저는 이러한 세부적인 매출을 통해 총매출을 예측하는 다중회귀모델을 찾아내고, 업종을 3가지로 구분해 각 업종별로 군집분석을 하는 것을 큰 주제로 정하려 합니다. import numpy as np..

Data Analysis 2022.04.01

RFM과 K-means 이용한 고객 데이터 분석 프로젝트 (with Kaggle 데이터)

예전에 RFM 등급을 통해 고객 데이터를 분석해봤었는데 새로운 고객 분석 기법을 알기도 했고 제가 고객 분석하는 것을 제일 좋아하기에 재미있게 진행했던 기억이 있었습니다. 그래서 다른 데이터에도 RFM 분석을 적용해보고 싶어 이번 프로젝트를 준비해보았습니다. https://www.kaggle.com/olistbr/brazilian-ecommerce Brazilian E-Commerce Public Dataset by Olist 100,000 Orders with product, customer and reviews info www.kaggle.com 캐글의 Brazilian E-coomerce Public 데이터를 이용해 고객 데이터 분석을 해보았습니다. 8개의 데이터가 있고 각 데이터들은 고유키를 기준..

Data Analysis 2022.03.16

파이썬 단어 간 상관관계 분석해보기

이걸 연관성 분석이라 불러도 될지 모르겠지만.. 단어 상관관계 분석을 해보겠습니다. 제가 사용한 데이터는 캐글의 넷플릭스 데이터입니다. Netflix Movies and TV Shows Listings of movies and tv shows on Netflix - Regularly Updated www.kaggle.com 이 데이터는 넷플릭스에 존재하는 프로그램들의 특징을 나타낸 것입니다. 그렇기에 프로그램이 어떤 장르인지 나타내는 컬럼이 있으며 , 한 프로그램 당 여러 개의 장르가 있는 경우가 많습니다. 예를 들어 8804행을 보면 해당 프로그램은 장르가 코미디이면서 스릴러 무비인 프로그램인 것입니다. 어떤 장르들끼리 묶여있는 경우가 많은지 보기 위해 상관관계를 살펴보기로 하였습니다. 위 값들을 아래..

Data Analysis 2022.02.27

SQL 분석 실습_Understanding Search Functionality

[무료] [백문이불여일타] 데이터 분석을 위한 SQL 실전편 (무료 미니 코스) - 인프런 | 강의 (inflearn.com) [무료] [백문이불여일타] 데이터 분석을 위한 SQL 실전편 (무료 미니 코스) - 인프런 | 강의 SQL은 실무에서 어떻게 활용되고 있을까요? Microsoft의 Yammer 서비스의 실제 데이터를 이용하여 문제를 해결하는 데이터 분석가가 되어봅시다., 백문이불여일타! SQL & 데이터 분석실무에 더 가깝게 www.inflearn.com 위의 강의를 듣고 정리한 내용입니다. Understanding Search Functionality | SQL Analytics Training - Mode Understanding Search Functionality | SQL Analyti..

SQL 2022.01.20
반응형