상세 컨텐츠

본문 제목

Reformat Department Table(LeetCode)

SQL/MySQL 문제풀이

by 관재탑 2022. 7. 20. 11:04

본문

https://leetcode.com/problems/reformat-department-table/

 

Reformat Department Table - LeetCode

Level up your coding skills and quickly land a job. This is the best place to expand your knowledge and get prepared for your next interview.

leetcode.com

 

 

문제

+-------------+---------+
| Column Name | Type    |
+-------------+---------+
| id          | int     |
| revenue     | int     |
| month       | varchar |
+-------------+---------+
(id, month) is the primary key of this table.
The table has information about the revenue of each department per month.
The month has values in ["Jan","Feb","Mar","Apr","May","Jun","Jul","Aug","Sep","Oct","Nov","Dec"]

Write an SQL query to reformat the table such that there is a department id column and a revenue column for each month.

Return the result table in any order.

The query result format is in the following example.

Input: 
Department table:
+------+---------+-------+
| id   | revenue | month |
+------+---------+-------+
| 1    | 8000    | Jan   |
| 2    | 9000    | Jan   |
| 3    | 10000   | Feb   |
| 1    | 7000    | Feb   |
| 1    | 6000    | Mar   |
+------+---------+-------+
Output: 
+------+-------------+-------------+-------------+-----+-------------+
| id   | Jan_Revenue | Feb_Revenue | Mar_Revenue | ... | Dec_Revenue |
+------+-------------+-------------+-------------+-----+-------------+
| 1    | 8000        | 7000        | 6000        | ... | null        |
| 2    | 9000        | null        | null        | ... | null        |
| 3    | null        | 10000       | null        | ... | null        |
+------+-------------+-------------+-------------+-----+-------------+
Explanation: The revenue from Apr to Dec is null.
Note that the result table has 13 columns (1 for the department id + 12 for the months).

 

 

정답쿼리

SELECT id, 
SUM(CASE WHEN month = 'Jan' THEN revenue ELSE NULL END) AS 'Jan_Revenue',
SUM(CASE WHEN month = 'Feb' THEN revenue ELSE NULL END) AS 'Feb_Revenue',
SUM(CASE WHEN month = 'Mar' THEN revenue ELSE NULL END) AS 'Mar_Revenue',
SUM(CASE WHEN month = 'Apr' THEN revenue ELSE NULL END) AS 'Apr_Revenue',
SUM(CASE WHEN month = 'May' THEN revenue ELSE NULL END) AS 'May_Revenue',
SUM(CASE WHEN month = 'Jun' THEN revenue ELSE NULL END) AS 'Jun_Revenue',
SUM(CASE WHEN month = 'Jul' THEN revenue ELSE NULL END) AS 'Jul_Revenue',
SUM(CASE WHEN month = 'Aug' THEN revenue ELSE NULL END) AS 'Aug_Revenue',
SUM(CASE WHEN month = 'Sep' THEN revenue ELSE NULL END) AS 'Sep_Revenue',
SUM(CASE WHEN month = 'Oct' THEN revenue ELSE NULL END) AS 'Oct_Revenue',
SUM(CASE WHEN month = 'Nov' THEN revenue ELSE NULL END) AS 'Nov_Revenue',
SUM(CASE WHEN month = 'Dec' THEN revenue ELSE NULL END) AS 'Dec_Revenue'
FROM Department
GROUP BY id
["id", "Jan_Revenue", "Feb_Revenue", "Mar_Revenue", "Apr_Revenue", "May_Revenue", "Jun_Revenue", "Jul_Revenue", "Aug_Revenue", "Sep_Revenue", "Oct_Revenue", "Nov_Revenue", "Dec_Revenue"] 
[1, 8000, 7000, 6000, null, null, null, null, null, null, null, null, null]
[2, 9000, null, null, null, null, null, null, null, null, null, null, null]
[3, null, 10000, null, null, null, null, null, null, null, null, null, null]

 

 

해설

Output에는 행으로는 id별로, 컬럼은 월별 revenue가 나와있다. GROUP BY id로 행별로 id가 나오게 한다.

아래 쿼리는 내가 처음으로 푼 쿼리인데 정답과 다르게 CASE문을 SUM으로 합해주지 않았다. 그러면 id=1의 2,3월의 값이 나오지 않게 된다. 왜 그럴까??

SELECT id, 
CASE WHEN month = 'Jan' THEN revenue ELSE NULL END AS 'Jan_Revenue',
CASE WHEN month = 'Feb' THEN revenue ELSE NULL END AS 'Feb_Revenue',
CASE WHEN month = 'Mar' THEN revenue ELSE NULL END AS 'Mar_Revenue',
CASE WHEN month = 'Apr' THEN revenue ELSE NULL END AS 'Apr_Revenue',
CASE WHEN month = 'May' THEN revenue ELSE NULL END AS 'May_Revenue',
CASE WHEN month = 'Jun' THEN revenue ELSE NULL END AS 'Jun_Revenue',
CASE WHEN month = 'Jul' THEN revenue ELSE NULL END AS 'Jul_Revenue',
CASE WHEN month = 'Aug' THEN revenue ELSE NULL END AS 'Aug_Revenue',
CASE WHEN month = 'Sep' THEN revenue ELSE NULL END AS 'Sep_Revenue',
CASE WHEN month = 'Oct' THEN revenue ELSE NULL END AS 'Oct_Revenue',
CASE WHEN month = 'Nov' THEN revenue ELSE NULL END AS 'Nov_Revenue',
CASE WHEN month = 'Dec' THEN revenue ELSE NULL END AS 'Dec_Revenue'
FROM Department
GROUP BY id
["id", "Jan_Revenue", "Feb_Revenue", "Mar_Revenue", "Apr_Revenue", "May_Revenue", "Jun_Revenue", "Jul_Revenue", "Aug_Revenue", "Sep_Revenue", "Oct_Revenue", "Nov_Revenue", "Dec_Revenue"]
[1, 8000, null, null, null, null, null, null, null, null, null, null, null]
[2, 9000, null, null, null, null, null, null, null, null, null, null, null]
[3, null, 10000, null, null, null, null, null, null, null, null, null, null]

SUM이라는 집계함수를 사용하지 않으면 Feb_Revenue컬럼에서 각 id에 해당하는 row들 중 첫번째 row를 조회한다. 여기서 CASE문은 첫번째 row에서 데이터를 추출하는데 적용된다. id=1인 데이터 중 첫번째 row는 revenue=8000, month=‘Jan’ 인데 CASE조건이 month='Feb'이면 revenue칼럼을, 아니면 Null을 반환하는 거여서 null값을 반환한다. 

 

Mar_revenue칼럼도 똑같다. 각 id에 해당하는 row들 중 첫번째 row를 조회하고 CASE문을 적용해서 첫번째 row를 추출하는데 id=1인 데이터 중 첫번째 row는 revenue=8000, month=‘Jan’여서 null값을 출력한다. 

 

SUM()의 역할이 여기서 나온다. SUM을 쓰지 않으면 각 id에 해당하는 row들 중 첫번째 row만 조회하고 밑의 row들은 조회하지 않는다. 그래서 Feb_revenue칼럼에서 id=1인 데이터 중 두번째 row인  revenue=7000, month=‘Feb’까지 내려가지 않고 첫번째 row인 revenue=8000, month=‘Jan’ 만 조회하고 여기에 CASE문을 적용해서 조건에 맞지 않아 Null값을 출력한 것이다. 

 

SUM()으로 CASE문을 감싸줘야 각 id별로 같은 row에 해당하는 revenue끼리의 합계를 구하는 것이라 id=1인 모든 데이터를 조회하고 거기에 CASE문을 적용해서 조건에 맞는 데이터들을 더해서 출력해주는 것이다. 그래서 Feb_revenue 컬럼의 첫번째 행에서 원본데이터에서 id=1인 데이터인 3개의 row를 모두 조회하고 그중에 CASE문을 만족하는 row하나만 출력하는 것이다.

 

관련글 더보기

댓글 영역