以下关于数据仓库Hive的说法不正确的是:
A.Hive主要是为分析数据而设计的数据仓库
B.Hive的数据最终都保存为HDFS文件
C.Hive将用户的查询语句转换为MapReduce作业提交到Hadoop集群上执行
D.Hive能够在大规模数据集上实现低延迟快速的查询
- · 有4位网友选择 D,占比36.36%
- · 有4位网友选择 A,占比36.36%
- · 有3位网友选择 B,占比27.27%
A.Hive主要是为分析数据而设计的数据仓库
B.Hive的数据最终都保存为HDFS文件
C.Hive将用户的查询语句转换为MapReduce作业提交到Hadoop集群上执行
D.Hive能够在大规模数据集上实现低延迟快速的查询
A.数据仓库是商业智能系统的基础 B.数据仓库是面向业务的,支持联机事务处理(OLTP) C.数据仓库是面向分析的,支持联机分析处理(0LAP) D.数据仓库中的数据视图往往是多维的
A.建立数据仓库的目的是提供决策支持 B.数据仓库管理系统包括对元数据的管理 C.联机分析处理技术(OLAP)主要实现数据的更新与删除 D.数据挖掘技术(DM)致力于知识的自动发现
A、HBase是一个基于列式存储的分布式数据库系统
B、HBase源于Google BigTable技术
C、HBase比传统关系数据库系统具有更加丰富的数据类型
D、HBase不支持复杂的SQL操作,例如表连接
A、<"hello",1><"hello",1><"frank",1><"lisa",1>
B、<"hello",2><"frank",1><"lisa",1>
C、<"hello",1,1><"frank",1><"lisa",1>
D、<"hello",<1,1>><"frank",1><"lisa",1>
A、MapReduce是一个分布式/并行编程模型,程序员通常只需要设计实现map和reduce函数
B、Shuffle过程是贯穿于map和reduce两个过程的
C、Hadoop MapReduce 1.0框架中TaskTracker负责集群资源的管理和调度
D、map和reduce的输入输出都是键值对
A、相比Mapreduce,Spark的中间数据放在内存中,对于迭代运算的效率更高
B、Spark支持使用Scala、Java、Python和R语言进行编程
C、RDD可从文件创建或通过对其他RDD执行转换操作而创建
D、窄依赖是划分Stage的依据,遇到窄依赖就划分stage
为了保护您的账号安全,请在“简答题”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!