上海麻将小游戏2|哈灵上海麻将辅助2018最新版功能
400-650-7353

精品课程

您所在的位置:首页 > IT就业指南 > 面试题 > 【大数据面试题】常见的大数据面试题(二)

【大数据面试题】常见的大数据面试题(二)

  • 来源:互联网
  • 2019-01-28 19:48:56
  • 阅读()
  • 分享
  • 手机端入口

大数据时代,许多工作都要依靠海量的数据,尤其是IT行业,那么做大数据工程师需要掌握哪些呢?以下就是一些大数据面试题

【大数据面试题】常见的大数据面试题(二)

1、怎么解决kafka的数据丢失

2、fsimage和edit的区别?

3、列举几个配置文件优化?

4、datanode 首次?#23588;?cluster 的时候,如果 log 报告不兼容文件版本,那需要namenode 执行格式化操作,这样处理的原因是?

5、MapReduce 中排序发生在哪几个阶段?这些排序是否可以避免?为什么?

6、hadoop的优化?

7、采集nginx产生的日志,日志的格式为user ip time url htmlId 每天产生的文件的数据量上亿条,请设计方案把数据保存到HDFS上,并提供一下实时查询的功能(响应时间小于3s)

8、有 10 个文件,每个文件 1G,每个文件的每一行存放的都是用户的 query,每个文件的query 都可能重复。要求你按照 query 的频度排序。 还是典型的 TOP K 算法,

9、在 2.5 亿个整数中?#39029;?#19981;重复的整数,注,内存不足以容纳这 2.5 亿个整数。

10、腾讯面试题:给 40 亿个不重复的 unsigned int 的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那 40 亿个数当中?

相关推荐:

【优就业大数据培训】从小白到大咖 打造大数据精英人才

【大数据培训教程】把握时代风口,做大数据架构师

>>本文地址:
注:本站稿件未经许可不得转载,转载请保留出处及源文件地址。

申请免费试听课程
课程干货资料
 

相关推荐

?#23588;?#38376;到进阶
免费干货资料

进群即领(备注“500G?#20445;?/span>
进群即领
(备注“500G?#20445;?/span>
 
 
上海麻将小游戏2 广东时时预测软件 21点规则 棋牌下载注册送18现金 飞艇助赢计划软件app 重庆时时彩组选包胆的平台 5分快3大小单双稳赢技巧 重庆时时采彩开奖今天 四川时时哪里买 全天重庆时时计免费计划 北京时时开奖号码结果 广东时时预测软件 21点规则 棋牌下载注册送18现金 飞艇助赢计划软件app 重庆时时彩组选包胆的平台 5分快3大小单双稳赢技巧 重庆时时采彩开奖今天 四川时时哪里买 全天重庆时时计免费计划 北京时时开奖号码结果