https://leetcode.com/problems/reformat-department-table/
Reformat Department Table - LeetCode
Level up your coding skills and quickly land a job. This is the best place to expand your knowledge and get prepared for your next interview.
leetcode.com
문제
+-------------+---------+
| Column Name | Type |
+-------------+---------+
| id | int |
| revenue | int |
| month | varchar |
+-------------+---------+
(id, month) is the primary key of this table.
The table has information about the revenue of each department per month.
The month has values in ["Jan","Feb","Mar","Apr","May","Jun","Jul","Aug","Sep","Oct","Nov","Dec"]
Write an SQL query to reformat the table such that there is a department id column and a revenue column for each month.
Return the result table in any order.
The query result format is in the following example.
Input:
Department table:
+------+---------+-------+
| id | revenue | month |
+------+---------+-------+
| 1 | 8000 | Jan |
| 2 | 9000 | Jan |
| 3 | 10000 | Feb |
| 1 | 7000 | Feb |
| 1 | 6000 | Mar |
+------+---------+-------+
Output:
+------+-------------+-------------+-------------+-----+-------------+
| id | Jan_Revenue | Feb_Revenue | Mar_Revenue | ... | Dec_Revenue |
+------+-------------+-------------+-------------+-----+-------------+
| 1 | 8000 | 7000 | 6000 | ... | null |
| 2 | 9000 | null | null | ... | null |
| 3 | null | 10000 | null | ... | null |
+------+-------------+-------------+-------------+-----+-------------+
Explanation: The revenue from Apr to Dec is null.
Note that the result table has 13 columns (1 for the department id + 12 for the months).
정답쿼리
SELECT id,
SUM(CASE WHEN month = 'Jan' THEN revenue ELSE NULL END) AS 'Jan_Revenue',
SUM(CASE WHEN month = 'Feb' THEN revenue ELSE NULL END) AS 'Feb_Revenue',
SUM(CASE WHEN month = 'Mar' THEN revenue ELSE NULL END) AS 'Mar_Revenue',
SUM(CASE WHEN month = 'Apr' THEN revenue ELSE NULL END) AS 'Apr_Revenue',
SUM(CASE WHEN month = 'May' THEN revenue ELSE NULL END) AS 'May_Revenue',
SUM(CASE WHEN month = 'Jun' THEN revenue ELSE NULL END) AS 'Jun_Revenue',
SUM(CASE WHEN month = 'Jul' THEN revenue ELSE NULL END) AS 'Jul_Revenue',
SUM(CASE WHEN month = 'Aug' THEN revenue ELSE NULL END) AS 'Aug_Revenue',
SUM(CASE WHEN month = 'Sep' THEN revenue ELSE NULL END) AS 'Sep_Revenue',
SUM(CASE WHEN month = 'Oct' THEN revenue ELSE NULL END) AS 'Oct_Revenue',
SUM(CASE WHEN month = 'Nov' THEN revenue ELSE NULL END) AS 'Nov_Revenue',
SUM(CASE WHEN month = 'Dec' THEN revenue ELSE NULL END) AS 'Dec_Revenue'
FROM Department
GROUP BY id
["id", "Jan_Revenue", "Feb_Revenue", "Mar_Revenue", "Apr_Revenue", "May_Revenue", "Jun_Revenue", "Jul_Revenue", "Aug_Revenue", "Sep_Revenue", "Oct_Revenue", "Nov_Revenue", "Dec_Revenue"]
[1, 8000, 7000, 6000, null, null, null, null, null, null, null, null, null]
[2, 9000, null, null, null, null, null, null, null, null, null, null, null]
[3, null, 10000, null, null, null, null, null, null, null, null, null, null]
해설
Output에는 행으로는 id별로, 컬럼은 월별 revenue가 나와있다. GROUP BY id로 행별로 id가 나오게 한다.
아래 쿼리는 내가 처음으로 푼 쿼리인데 정답과 다르게 CASE문을 SUM으로 합해주지 않았다. 그러면 id=1의 2,3월의 값이 나오지 않게 된다. 왜 그럴까??
SELECT id,
CASE WHEN month = 'Jan' THEN revenue ELSE NULL END AS 'Jan_Revenue',
CASE WHEN month = 'Feb' THEN revenue ELSE NULL END AS 'Feb_Revenue',
CASE WHEN month = 'Mar' THEN revenue ELSE NULL END AS 'Mar_Revenue',
CASE WHEN month = 'Apr' THEN revenue ELSE NULL END AS 'Apr_Revenue',
CASE WHEN month = 'May' THEN revenue ELSE NULL END AS 'May_Revenue',
CASE WHEN month = 'Jun' THEN revenue ELSE NULL END AS 'Jun_Revenue',
CASE WHEN month = 'Jul' THEN revenue ELSE NULL END AS 'Jul_Revenue',
CASE WHEN month = 'Aug' THEN revenue ELSE NULL END AS 'Aug_Revenue',
CASE WHEN month = 'Sep' THEN revenue ELSE NULL END AS 'Sep_Revenue',
CASE WHEN month = 'Oct' THEN revenue ELSE NULL END AS 'Oct_Revenue',
CASE WHEN month = 'Nov' THEN revenue ELSE NULL END AS 'Nov_Revenue',
CASE WHEN month = 'Dec' THEN revenue ELSE NULL END AS 'Dec_Revenue'
FROM Department
GROUP BY id
["id", "Jan_Revenue", "Feb_Revenue", "Mar_Revenue", "Apr_Revenue", "May_Revenue", "Jun_Revenue", "Jul_Revenue", "Aug_Revenue", "Sep_Revenue", "Oct_Revenue", "Nov_Revenue", "Dec_Revenue"]
[1, 8000, null, null, null, null, null, null, null, null, null, null, null]
[2, 9000, null, null, null, null, null, null, null, null, null, null, null]
[3, null, 10000, null, null, null, null, null, null, null, null, null, null]
SUM이라는 집계함수를 사용하지 않으면 Feb_Revenue컬럼에서 각 id에 해당하는 row들 중 첫번째 row를 조회한다. 여기서 CASE문은 첫번째 row에서 데이터를 추출하는데 적용된다. id=1인 데이터 중 첫번째 row는 revenue=8000, month=‘Jan’ 인데 CASE조건이 month='Feb'이면 revenue칼럼을, 아니면 Null을 반환하는 거여서 null값을 반환한다.
Mar_revenue칼럼도 똑같다. 각 id에 해당하는 row들 중 첫번째 row를 조회하고 CASE문을 적용해서 첫번째 row를 추출하는데 id=1인 데이터 중 첫번째 row는 revenue=8000, month=‘Jan’여서 null값을 출력한다.
SUM()의 역할이 여기서 나온다. SUM을 쓰지 않으면 각 id에 해당하는 row들 중 첫번째 row만 조회하고 밑의 row들은 조회하지 않는다. 그래서 Feb_revenue칼럼에서 id=1인 데이터 중 두번째 row인 revenue=7000, month=‘Feb’까지 내려가지 않고 첫번째 row인 revenue=8000, month=‘Jan’ 만 조회하고 여기에 CASE문을 적용해서 조건에 맞지 않아 Null값을 출력한 것이다.
SUM()으로 CASE문을 감싸줘야 각 id별로 같은 row에 해당하는 revenue끼리의 합계를 구하는 것이라 id=1인 모든 데이터를 조회하고 거기에 CASE문을 적용해서 조건에 맞는 데이터들을 더해서 출력해주는 것이다. 그래서 Feb_revenue 컬럼의 첫번째 행에서 원본데이터에서 id=1인 데이터인 3개의 row를 모두 조회하고 그중에 CASE문을 만족하는 row하나만 출력하는 것이다.
Employees Earning More Than Their Managers(LeetCode) (0) | 2022.07.20 |
---|---|
Customers Who Never Order(LeetCode) (0) | 2022.07.20 |
Type of Triangle(HackerRank) (0) | 2022.07.18 |
Top Earners(HackerRank) (0) | 2022.07.18 |
Weather Observation Station 15(HackerRank) (0) | 2022.07.18 |
댓글 영역