HADOOP的特性描述正确的是()
A.系统内不适合多表复杂关联,需要在数据进入HADOOP前做好数据关联
B.适合非低延迟数据处理
C.集群支持分布式并行写入,并发写入速度快
D.大数据的关联能力弱
- · 有3位网友选择 D,占比33.33%
- · 有2位网友选择 BC,占比22.22%
- · 有2位网友选择 C,占比22.22%
- · 有1位网友选择 ABC,占比11.11%
- · 有1位网友选择 BD,占比11.11%
A.系统内不适合多表复杂关联,需要在数据进入HADOOP前做好数据关联
B.适合非低延迟数据处理
C.集群支持分布式并行写入,并发写入速度快
D.大数据的关联能力弱
A.MPP数据库和Hadoop技术均有其各自的优劣势以及适用的场景
B.实际应用中不必须采用MPP数据库和Hadoop技术的混搭方案
C.对于大规模的复杂分析、即时查询、多表复杂关联等场景,由MPP数据库处理
D.非结构化数据处理、流处理以及大规模批量复杂作业,由Hadoop架构负责
A.Hadoop和Spark可以相互协作
B.Hadoop负责数据的存储和管理
C.Spark负责数据的计算
D.Spark要操作Hadoop中的数据,需要先启动HDFS
A.提供了资源管理能力
B.是开源数据仓库系统,用于查询和分析存储在Hadoop中的大型数据集
C.是Hadoop数据处理层
D.是Hadoop数据存储层
A.HADOOP就是传统关系数据库加上大存储。
B.HADOOP是万能的,可以替代传统关系数据库。
C.HADOOP关联运算能力弱,单字段查询速度快,开发能力要求高,适合做底层数据存储以及单一查询操作。
D.传统关系数据库查询效率较高,交互能力强,但可处理的数据量有限,适合完成频繁交互、事务型操作。
A.在同一个工作区可以打开多个表并建立关联
B.在多表操作中,不能取用非当前工作区的表数据
C.在多表操作中,一个表可在不同工作区打开
D.在多表关联操作中,只能建立两个表的关联,不能同时建立多个表的关联
A.Hadoop是一个由Apache基金会开发的分布式系统开源架构
B.Hadoop的初始设计思想来源于Google发布的学术论文
C.Hadoop在当前衍生的一系列优秀的开源项目,包括Hbase,Hive等
D.Hadoop的两个核心部分是HDFS和MapReduce计算框架
A、Hadoop已经不再只是起初的HDFS 和MapReduce,而是代表了核心即Core Hadoop,Hadoop项目以及与之相关的一个生态系统。
B、Hive是一种新的结构化查询语言。Sqoop支持Hadoop和关系数据库或大型机之间传输数据。Pig一个基于Hadoop的大规模数据分析工具。它们都属于数据访问的组建。
C、Flume是一个可伸缩的、可靠的系统,用于从各种来源收集和移动集群日志。ZooKeeper通过简单的编程接口实现分布式系统的分布式协调服务。它们都属于数据管理的组建。
D、以上都正确
A、Hadoop是一个有Apache基金会开发的分布式系统开源架构,设计来源于Google的学术论文。
B、Hadoop最核心的功能是提供了大数据的分布式存储MapReduce和并行计算框架HDFS。
C、Hadoop 能够组织和管理成百上千台计算机。
D、Hadoop已衍生出了很多开源项目如HBase、Hive、ZooKeeper等,逐渐发展成了Hadoop生态系统。
A.1.7PB
B.3.9PB
C.5.0PB
D.2.8PB
A.Hadoop是一个能够对大量数据进行分布式处理的软件框架
B.作为并行分布式计算平台,Hadoop采用分布式存储和分布式处理两大核心技术,能够高效地处理PB级数据
C.Hadoop只支持Java编程语言
D.Hadoop可以高效稳定地运行在廉价的计算机集群上,可以扩展到数以千计的计算机节点上
为了保护您的账号安全,请在“简答题”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!