当前位置: 首页 > news >正文

携程-酒旅-数据研发面经【附答案】

来源:2025年4月面试辅导同学全程分享【已拿23Koffer】

推荐阅读文章列表

2025最新大数据开发面试笔记V6.0——试读

我的大数据学习之路

面试聊数仓第一季

1.八股文

1)MapReduce如何实现两表的JOIN

参考面试笔记V6.0 Hive篇第7题,部分答案如下:

  • JOIN分为common join和map join,common join就是join发生在reduce端,map join就是join发生在map端

2)Hive的存储格式有哪些

参考面试笔记V6.0 Hive篇第14题

3)HQL解析的原理是什么

参考面试笔记V6.0 Hive篇第1题

4)Hive导入数据有几种方式

参考面试笔记V6.0 Hive篇第16题(补充),答案如下:

  • 本地文件导入到Hive表:load data local inpath xxx overwrite into table xxx
  • HDFS文件导入到Hive表:load data inpath xxx overwrite into table xxx
  • 一张Hive表导入到另一张Hive表:insert overwrite table xxx2 select * from xxx1
  • 创建Hive表时从另外一张Hive表导入:create table xxx2 as select * from xxx1

5)Spark SQL的Join有几种方式

参考面试笔记V6.0 Spark篇第20题

6)Spark代码发生数据倾斜,你是如何定位到哪段代码问题的

参考面试笔记V6.0 调优技巧篇,部分答案如下:

7)Spark任务慢,如何通过调整参数来提升时效

参考面试笔记V6.0 Spark篇第4题和第27题

8)ER模型和维度建模的优缺点

参考面试笔记V6.0 数仓理论篇第5题,部分答案如下:

  • ER模型冗余更少,但在大规模数据跨表分析中,会造成多表关联,大大地降低计算效率

2.项目

1)项目中的难点是什么?
2)数仓中的数据是如何流转的?
3)项目中的数据血缘是如何管理的?【Atlas开源工具 或者 ParseDriver解析工具】
后续分享我是如何通过ParseDriver来构建数据血缘的

3.刷题

SQL题:给定一个打卡表(部门id,用户id,打卡时间),求每个部门打卡频次前10的员工

select dept_id, uid
from (select dept_id,uid,row_number() over(partition by dept_id order by cnt desc) rkfrom (selectdept_id,uid,count(distinct dt) as cntfrom t1group by dept_id, uid) t
) t
where rk <= 10

相关文章:

  • go语言中defer使用指南
  • 逻辑思维:从混沌到秩序的理性推演在软件开发中的应用
  • 使用Nacos 打造微服务配置中心
  • Go语言之sync包 WaitGroup的使用和底层实现
  • 文件操作函数
  • 基于cubeMX的hal库STM32实现硬件IIC通信控制OLED屏
  • 汽车VIN码识别:解锁汽车行业的智能密码
  • Spark-SQL 项目
  • 爬虫(requests库,logging库)
  • react 父子组件通信 子 直接到父, 父 forwardref子
  • window上 elasticsearch v9.0 与 jmeter5.6.3版本 冲突,造成es 启动失败
  • 关于在Springboot中设置时间格式问题
  • Git -> Git 所有提交阶段的回滚操作
  • 测试-时间规模化定律可以改进世界基础模型吗?
  • [Java · 铢积寸累] 数据结构 — 二维数组 - 概念引入
  • 【YOLOv8-pose部署至RK3588】模型训练→转换RKNN→开发板部署
  • docker保存镜像到本地
  • AutoJs相关学习
  • Spring Boot中`logging.config`配置项的详解及使用说明
  • Vscode指定缓存路径 .vscode 路径
  • 海上生明月,九天揽星河,2025年“中国航天日”主场活动在上海启动
  • 台媒称美派遣前军官出任“汉光演习”资深观察员,国防部回应
  • A股三大股指涨跌互现,工农中三大行股价创新高
  • 研讨会|中国古代石刻与历史研究的多重图景
  • 首开股份:去年亏损约81.4亿元,是公司发展史上极其困难的一年
  • 游客大理古城买瓜起争执:170克手机称出340克