暖心的小编又来了,这次给你们整理了一些常见的大数据面试题,希望对你们有帮助哦
大数据面试题
1. HDFS数据存储是由哪个程序负责的?答: Datanode2. Hadoop的作者是谁?答:doug cutting3. 集群最主要的瓶颈是?答:磁盘4. Hadoop运行模式是?答:单机版伪分布式分布式5. 安装CDH的方法由CLOUDERA提供,它的安装方法是?答: Cioudera manager Tarball Yum Rpm6. 哪些项目可以作为集群的管理?答: Puppet Pdsh Zookeeper7. spark和hadoop的区别,和各自的优势答:Spark和hadoop都是大数据应用框架系统。spark速度快,易于使用,是大数据学习时需要使用的系统;hadoop是分布式文件系统,其实就是一种软件库和框架。Spark和hadoop是一种互相共生的关系,hadoop拟补了spark没有的功能性,spark为数据提供了内存整理。8. String和stringBuffer的区别是什么答:string是对象是不可变的对象,不能修改它的值,stringbuffer是一个可变对象,对他进行修改的时候不会像string那样重新建立对象。9. Java中,int和integer的区别答:int是基本数据类型,integer是一种包装,intrger可存储int并添加int。10. Arraylist 和 linkedlist的特性答:ArrayList 采用的是通过数字组合的方式保存对象的,并将对象放在连续的位置中,缺点是插入删除时非常麻烦;
LinkedList 采用的是将对象存放在独立的空间中,而且在存放中还保存下一个对象的搜索引擎,缺点是查找比较麻烦,要从第一个开始。光环大数据小编给你们用心良苦整理出来的,希望对你们有帮助。相