面试新收获-窗口排序函数
背景
2025年4月26日
今天参加了一家公司的二面,有一个问题没有听过,sql里面的“窗口排序函数的区别”
窗口,ok,我知道一些,
排序,ok,我知道,
函数,ok,我知道,
排序函数,ok,我知道
窗口排序函数,???
确实忘了,还导致面试官质疑科班身份,搞得我下来了还特意去查了本科学的《数据库系统概论》,好像没有啊
ok,算了,问GPT
1. 什么是窗口函数?
窗口函数(Window Function)是针对查询结果中的每一行,根据定义好的窗口(分组+排序规则)计算一个额外值,而不影响原来的行数!
窗口函数的结构:
函数名() OVER ([PARTITION BY 分组字段] ORDER BY 排序字段)
部分 | 含义 |
---|---|
函数名() | 比如 RANK(), DENSE_RANK(), SUM(), AVG() |
OVER | 必须有的关键字 |
PARTITION BY | 按某列分组(可选) |
ORDER BY | 按某列排序(通常必选) |
2. 常见排序类窗口函数(核心)
函数名 | 作用 | 特点 |
---|---|---|
ROW_NUMBER() | 全局唯一递增编号(无跳号) | 不管值是否相同 |
RANK() | 相同值排名相同,后续跳号 | 有跳号 |
DENSE_RANK() | 相同值排名相同,后续不跳号 | 不跳号 |
3. 三个函数的具体区别(超重要)
比如我们有这样一组分数数据(score越高排越前):
id | score |
---|---|
1 | 100 |
2 | 90 |
3 | 90 |
4 | 80 |
排序规则:score降序(DESC)
函数 | 结果(id顺序) |
---|---|
ROW_NUMBER() | 1,2,3,4(严格递增,不管值是否相同) |
RANK() | 1,2,2,4(值相同名次一样,后面跳号) |
DENSE_RANK() | 1,2,2,3(值相同名次一样,后面连续编号) |
ROW_NUMBER() 流程(严格编号,不管分数是否相同)
--------------------------------------------------
id: 1 score: 100 row_number: 1
id: 2 score: 90 row_number: 2
id: 3 score: 90 row_number: 3
id: 4 score: 80 row_number: 4RANK() 流程(相同分数占同一名,后面跳号)
--------------------------------------------------
id: 1 score: 100 rank: 1
id: 2 score: 90 rank: 2
id: 3 score: 90 rank: 2
id: 4 score: 80 rank: 4DENSE_RANK() 流程(相同分数占同一名,后面连续编号)
--------------------------------------------------
id: 1 score: 100 dense_rank: 1
id: 2 score: 90 dense_rank: 2
id: 3 score: 90 dense_rank: 2
id: 4 score: 80 dense_rank: 3
4.核心对比总结表
函数 | 相同分数占同一名? | 排名跳号? | 特点 |
---|---|---|---|
ROW_NUMBER() | 否(每行唯一编号) | 否 | 不管分数是否相同,依次递增编号 |
RANK() | 是 | 是 | 相同分数排名一样,后面跳号 |
DENSE_RANK() | 是 | 否 | 相同分数排名一样,后面连续 |
5.每个函数的应用场景
1. ROW_NUMBER()
应用场景
-
分页查询(比如取第11-20条数据)
-
需要唯一行号编号的场景(比如流水线、排名流水)
2. RANK()
应用场景
-
标准排行榜,相同分数并列排名,后续跳号
-
比赛计分系统,要求同分并列+跳过名次
3. DENSE_RANK()
应用场景
-
紧凑型排行榜,相同分数并列但后续不跳名次
-
积分等级评定,要求排名连续紧凑
实操
SELECTuser_id,score,RANK() OVER (ORDER BY score DESC) AS rank,DENSE_RANK() OVER (ORDER BY score DESC) AS dense_rank,ROW_NUMBER() OVER (ORDER BY score DESC) AS row_number
FROMuser_scores;