内容摘要
失效链接处理 数仓面试题 PDF 下载 本站整理下载: 链接: https://pan.baidu.com/s/1xxRWmS348SAxWnroGb1Zpg 提取码: jdiz 相关截图: 主要内容: 近期遇到的数仓⾯试题 数仓理论部分 1 星型模型、雪花模型区别,说说他们的优缺点? 2 你们数仓⽤了什么模型,说说为什么? 3 说说你们数仓的结构层次? 4 你有做过实时数仓吗,说说实时数仓⽅案。 MapReduce 1 讲⼀下MapReduce的全流程,重点突出shuffel部分,越细越好。 2 map个数, reduce个数怎样决定的? 3 fileinputformat 切分⽂件算法 4 hdfs写⼊流程是怎样的? HIVE 1 有遇到过数据倾斜吗,怎样解决的? 2 ⼩⽂件问题怎么解决? 3 你们的hive表使⽤什么⽂件格式存储,不同的⽂件格式有啥区别? 4 ⼀条hql是怎么转化成MapReduce程序。 Kafka 有没有⼿动管理过offset,实现exactly once ?
本站为你提供的『数仓面试题 PDF 下载』为【百度云搜搜】搜索整理的结果,信息来源于第三方网站,本站只提供检索服务,不存储任何资源。本页面由蜘蛛程序自动抓取生成,如有侵权违规,可点击下方联系我们举报,我们立即删除。