面试官:我看你简历上写了了解大数据的相关内容是么?
阿粉朋友:是呀,因为做了好几年的开发了,总想着也学习一下这块的内容啥的。
面试官:那你说说你了解的这些内容吧。
阿粉朋友:了解的哪些内容?
面试官:就你在简历上写的这几个,Hadoop,MapReduce,还有就HDFS。
这时候阿粉朋友心中一万个 ZZ 飘过,这东西咋说,说自己安装?搭建?还是啥,但是这时候也不能慌呀,毕竟也算是自己学习过一点的,虽然没有正式在项目中使用过,于是阿粉朋友就开始说:
Hadoop项目结构实际上由很多个组成部分,像我在简历中写的,HDFS 分布式文件系统,MapReduce 分布式并行编程模型,YARN 资源管理和调度器,Hive 数据仓库,还有就是 HBase 非关系型数据库,
HDFS三个核心组件是 NameNode,DataNode,SecondaryNameNode,比如说 NameNode 是集群的核心, 是整个文件系统的管理节点也是维护者,DataNode 存放具体数据块的节点, 主要负责数据的读写, 定期向 NameNode 发送心跳,而 SecondaryNameNode 算是辅助节点, 同步NameNode中的元数据信息。
然后面试官就开始打断我了,就对阿粉说,这块内容在实际的工作中,你用过么?阿粉朋友的回答的也确实是没有用过这块,自己只是在工作之余,利用业余的时间去学习了一下有关这方面的内容,扩充一下自己的知识面,接下来面试官就好像盯着阿粉不是很了解这块的内容就开始了无情的发问。
1.NameNode 的工作机制你了解么?
阿粉朋友回答:主要分为了2个阶段,第一阶段是 NameNode 启动,第二阶段是 Secondary NameNode 工作,然后简单细说了一下,于是面试官给阿粉的朋友纠正了一些不合适的地方。
2.正常工作的hadoop集群中hadoop都需要启动哪些进程
这阿粉的朋友因为没有在工作中使用过,于是说了不知道,面试官就开始说起了这块的内容,
最后在面试结束的时候,就说了一句,这就是你自学的这块的内容?当阿粉听到面试官有说这句话的时候,是不是就是有点过分的含义,毕竟人家只是自学的,也没有实际的开发经验,就算学的不怎么样,也没必要这么过分不是么?
也可能是面试官确实会这块的内容,但是阿粉听到这里实际上就已经开始听不下去了,毕竟你是面试官,你的主要内容是不是应该面试,毕竟人家面试的是 Java 开发,也不算是大数据工程师,你直接给“整活”,是不是有点不太好。