IT评测·应用市场-qidao123.com

标题: 史上最全141道大数据口试题:Redis+Linux+kafka+Hadoop,附答案 [打印本页]

作者: 道家人    时间: 2024-7-13 15:52
标题: 史上最全141道大数据口试题:Redis+Linux+kafka+Hadoop,附答案
Linux口试专题及答案
============
Kafka口试专题及答案
============
大数据口试题大全
========
1、kafka 的 message 包括哪些信息
2、怎么查看 kafka 的 offset
3、hadoop 的 shuffle 过程
4、spark 集群运算的模式
5、HDFS 读写数据的过程
6、RDD 中 reduceBykey 与 groupByKey 哪个性能好,为什么
7、spark2.0 的相识
8、 rdd 怎么分区宽依赖和窄依赖
9、spark streaming 读取 kafka 数据的两种方式
10、kafka 的数据存在内存还是磁盘
11、怎么办理 kafka 的数据丢失
12、fsimage 和 edit 的区别?
13、枚举几个设置文件优化?
14、datanode 首次加入 cluster 的时候,如果 log 报告不兼容文件版本,那需要namenode 执行格式化操作,这样处置惩罚的原因是?
15、MapReduce 中排序发生在哪几个阶段?这些排序是否可以避免?为什么?
16、hadoop 的优化?
17、设计题
18、有 10 个文件,每个文件 1G,每个文件的每一行存放的都是用户的 query,每个文件的 query 都可能重复。要求你按照 query 的频度排序。 还是典范的 TOP K 算法?
19、在 2.5 亿个整数中找出不重复的整数,注,内存不足以容纳这 2.5 亿个整数。
20、腾讯口试题:给 40 亿个不重复的 unsigned int 的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那 40 亿个数当中?
21、怎么在海量数据中找出重复次数最多的一个?
22、上万万或上亿数据(有重复),统计其中出现次数最多的钱 N 个数据。
23、一个文本文件,约莫有一万行,每行一个词,要求统计出其中最频繁出现的前 10 个词,给出思想,给出时间复杂度分析。
24、100w 个数中找出最大的 100 个数。
25、有一万万条短信,有重复,以文本文件的形式保存,一行一条,有重复。 请用 5 分钟时间,找出重复出现最多的前 10 条。
Hadoop口试题及答案
============
1.您对“大数据”一词有何相识?
2.大数据的五个V是什么?
自我先容一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到如今。
深知大多数Linux运维工程师,想要提升技能,往往是本身摸索成长大概是报班学习,但对于培训机构动则几千的学费,着实压力不小。本身不成体系的自学结果低效又漫长,而且极易遇到天花板技术故步自封!
因此收集整理了一份《2024年Linux运维全套学习资料》,初衷也很简朴,就是盼望可以或许帮助到想自学提升又不知道该从何学起的朋友,同时减轻各人的负担。





既有适合小白学习的零基础资料,也有适合3年以上履历的小同伴深入学习提升的进阶课程,基本涵盖了95%以上Linux运维知识点,真正体系化!
由于文件比较大,这里只是将部门目录大纲截图出来,每个节点内里都包含大厂面经、学习笔记、源码讲义、实战项目、讲授视频,而且后续会连续更新
如果你以为这些内容对你有帮助,可以添加VX:vip1024b (备注Linux运维获取)

为了做好运维口试路上的助攻手,特整理了上百道 【运维技术栈口试题集锦】 ,让你口试不慌心不跳,高薪offer怀里抱!
这次整理的口试题,小到shell、MySQL,大到K8s等云原生技术栈,不仅适合运维新人入行口试需要,还适用于想提升进阶跳槽加薪的运维朋友。

本份口试集锦涵盖了

总计 1000+ 道口试题, 内容 又全含金量又高

   1、什么是运维?
    2、在工作中,运维人员经常需要跟运营人员打交道,叨教运营人员是做什么工作的?
    3、如今给你三百台服务器,你怎么对他们进行管理?
    4、简述raid0 raid1raid5二种工作模式的工作原理及特点
    5、LVS、Nginx、HAproxy有什么区别?工作中你怎么选择?
    6、Squid、Varinsh和Nginx有什么区别,工作中你怎么选择?
    7、Tomcat和Resin有什么区别,工作中你怎么选择?
    8、什么是中间件?什么是jdk?
    9、报告一下Tomcat8005、8009、8080三个端口的寄义?
    10、什么叫CDN?
    11、什么叫网站灰度发布?
    12、简述DNS进行域名解析的过程?
    13、RabbitMQ是什么东西?
    14、讲一下Keepalived的工作原理?
    15、报告一下LVS三种模式的工作过程?
    16、mysql的innodb如何定位锁问题,mysql如何减少主从复制延迟?
    17、如何重置mysql root密码?
  一个人可以走的很快,但一群人才气走的更远。岂论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术互换、学习资源、职场吐槽、大厂内推、口试辅导),让我们一起学习成长!

述一下Tomcat8005、8009、8080三个端口的寄义?
   10、什么叫CDN?
    11、什么叫网站灰度发布?
    12、简述DNS进行域名解析的过程?
    13、RabbitMQ是什么东西?
    14、讲一下Keepalived的工作原理?
    15、报告一下LVS三种模式的工作过程?
    16、mysql的innodb如何定位锁问题,mysql如何减少主从复制延迟?
    17、如何重置mysql root密码?
  一个人可以走的很快,但一群人才气走的更远。岂论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术互换、学习资源、职场吐槽、大厂内推、口试辅导),让我们一起学习成长!
[外链图片转存中…(img-h6UrzCjV-1712894031701)]

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 IT评测·应用市场-qidao123.com (https://dis.qidao123.com/) Powered by Discuz! X3.4