Hadoop框架的缺陷有?()
A.无法高效低支持迭代式计算
B.海量的数据存储
C.过多的磁盘操作,缺乏对分布式内存的支持
D.表达能力有限,MR编程框架的限制
A.无法高效低支持迭代式计算
B.海量的数据存储
C.过多的磁盘操作,缺乏对分布式内存的支持
D.表达能力有限,MR编程框架的限制
A.MR框架过多的磁盘操作,缺乏对分布式内存的支持
B.MR框架无法高效地支持迭代式计算
C.MR框架无法高效地支持交互式数据挖掘任务
D.MR框架无法进行分析性计算任务
A.HBase利用MapReduce来处理HBase中的海量数据,实现高性能计算
B.利用Zookeeper作为协同服务,实现稳定服务和失败恢复
C.使用HDFS作为高可靠的底层存储,利用廉价集群提供海量数据存储能力
D.利用Pig和Hive为HBase提供了高层语言支持
E.使用Sqoop为HBase提供了高效便捷的RDBMS数据导入功能
A.Hadoop是一个能够对大量数据进行分布式处理的软件框架
B.作为并行分布式计算平台,Hadoop采用分布式存储和分布式处理两大核心技术,能够高效地处理PB级数据
C.Hadoop只支持Java编程语言
D.Hadoop可以高效稳定地运行在廉价的计算机集群上,可以扩展到数以千计的计算机节点上
A.传统的机器学习算法,由于技术和单机存储的限制,大多只能在少量数据上使用
B.利用MapReduce框架在全量数据上进行机器学习,这在一定程度上解决了统计随机性的问题,提高了机器学习的精度
C.MapReduce可以高效支持迭代计算
D.Spark无法高效支持迭代计算
A.Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中
B.Hadoop被视为事实上的大数据处理标准
C.Hadoop为海量数据提供存储的HDFS和对数据进行计算的MapReduce
D.Hadoop提供整个HDFS文件系统的命名空间管理,块管理等所有服务
A.为海量数据提供存储的HDFS和对数据进行计算的MapReduce
B.提供整个HDFS文件系统的NameSpace(命名空间)管理、块管理等所有服务
C.Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中
D.Hadoop被视为事实上的大数据处理标准
A.[A]Impala作为开源大数据分析引擎,支持实时计算,它提供了与Hive类似的功能,并在性能上比Hive高出3~30倍
B.[B]Impala是由Cloudera公司开发的查询系统
C.[C]Impala提供了SQL语义,能查询存储在Hadoop的HDFS和HBase上的PB级别海量数据
D.[D]Impala最初是参照MySQL系统进行设计的
A.提供多种数据集操作类型而不仅限于MapReduce
B.数据集中式计算更加高效
C.提供了内存计算,带来了更高的迭代运算效率
D.基于DAG的任务调度执行机制
为了保护您的账号安全,请在“简答题”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!