下列关于Hadoop组件的说法,正确的有()。①HDFS是基于流数据模式访问和处理超大文件的需求而开发的,可以运行于廉价的商用服务器上;②Hive是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制;③Flume采用了Agent、Gossip和Storage三层架构;④Sqoop主要设计目的是在Hadoop与传统数据库之间进行数据的ETL操作
A.①②③
B.①②④
C.②③④
D.①③④
A.①②③
B.①②④
C.②③④
D.①③④
A.Hive最终将数据存储在HDFS中
B.HiveSQL其本质是执行的MapReduce任务
C.Hive是Hadoop平台的数据仓库工具
D.Hive对HBase有强依赖
A.sqoop可以将HQL/SQL的执行结果导入到Oracle或者Hive
B.不能大于1M
C.sqoop使用参数-m(即--num-mappers)进行导数时,分布在每一个map上的数据是均匀的
D.sqoop将数据导入Oracle时遇到值的长度超长,sqoop会继续将正常的数据导入Oracle
A.Hive最终将数据存储在HDFS中
B.HiveSQL其本质是执行MapReduce任务
C.Hive是Hadoop平台的数据仓库工具
D.Hvie对HBase有强依赖
A.Hive最终将数据存储在HDFS中
B.Hive是Hadoop平台的数据仓库工具
C.HQL可以通过MapReduce执行任务
D.Hive对HBase有强依赖
A.Zookeeper是一个集群管理工具,常用于分布式计算,提供配置维护、域名服务、分布式同步等
B.如果不启动Hadoop,则HBase完全无法使用
C.如果通过HBase Shell插入表数据,可以插入一行数据或一个单元格数据
D.HBase的实现包括的主要功能组件是库函数,一个Master主服务器和一个Region服务器
A.HBase的实现包括的主要功能组件是库函数,一个Master主服务器和一个Region服务器
B.Zookeeper是一个集群管理工具,常用于分布式计算,提供配置维护、域名服务、分布式同步等。
C.如果不启动Hadoop,则HBase完全无法使用
D.如果通过HBase Shell插入表数据,可以插入一行数据或一个单元格数据。
A.HBase的实现包括的主要功能组件是库函数,一个Master主服务器和一个Region服务器
B.Zookeeper是一个集群管理工具,常用于分布式计算,提供配置维护、域名服务、分布式同步等。
C.如果不启动Hadoop,则HBase完全无法使用
D.如果通过HBaseShell插入表数据,可以插入一行数据或一个单元格数据。
A.Spark只是取代了Hadoop生态系统中的计算框架MapReduce,而Hadoop中的其他组件依然在企业大数据系统中发挥着重要的作用
D.[D]越来越多的企业放弃MapReduce,转而使用Spark开发企业应用
A.HiBench可用于评估大数据框架的性能
B.HiBench是一款闭源的大数据基准测试套件
C.Hi Bench支持Hadoop、Spark等组件
D.Hi Bench支持hadoopbench、flinkbench、stormbench等框架
A.Pig:处理大规模数据的脚本语言
B.Tez:支持DAG作业的计算框架
C.Oozie:工作流和协作服务引擎
D.Kafka:分布式发布订阅消息系统
A.Tez:支持DAG作业的计算框架
B.Kafka:分布式发布订阅消息系统
C.Pig:处理大规模数据的脚本语言
D.Oozie:工作流和协作服务引擎
为了保护您的账号安全,请在“简答题”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!