以下哪个是Mapreduce正确的流程?()
A.map->reduce->shuffle
B.shuffle->map->reduce
C.map->shuffle->reduce
D.shuffle->reduce->map
- · 有4位网友选择 A,占比50%
- · 有2位网友选择 D,占比25%
- · 有1位网友选择 B,占比12.5%
- · 有1位网友选择 C,占比12.5%
A.map->reduce->shuffle
B.shuffle->map->reduce
C.map->shuffle->reduce
D.shuffle->reduce->map
A、MapReduce是一种计算框架
B、MapReduce来源于google的学术论文
C、MapReduce程序只能用java语言编写
D、MapReduce隐藏了并行计算的细节,方便使用
B.ChainMapper和ChainReducer类可以用来简化数据预处理和后处理的构成
C.使用ChainReducer时,每个mapper和reducer对象都有一个本地JobConf对象
D.ChainReducer.addMapper()方法中,一般对键/值对发送设置成值传递,性能好且安全性高
B.MapReduce设计的一个理念就是“ 计算向数据靠拢”
C.MapReduce框架采用了Master/Slave架构
D.MapReduce应用程序只能用Java来写
A、两次出现的意义相同
B、两个引用的test.jar都是保存在大数据计算服务上的资源
C、两个引用的test.jar都是保存在本地
D、classpath引用的是main函数,运行于本地,指定的jar包路径,即本地文件路径
A、包括已上传到大数据计算服务的MR程序本身所在的jar包,以及MR程序用到的大数据计算服务上的资源
B、仅包含MR程序中用到的大数据计算服务上的资源
C、仅包含保存在本地的MR程序本身所在的jar包
D、仅包含已上传到大数据计算服务的MR程序本身所在的jar包
A、将这个字典与源代码一起进行打包,直接执行即可
B、每次都将字典文件作为资源上传到大数据计算服务上,然后MR中通过资源的方式来访问
C、将字典打包jar包,使用jar命令执行MR程序时,通过resources参数指定该jar包
D、将字典文件保存在本地,在MR中通过访问本地最新的字典文件实现
A、Flink是一行一行地处理数据
B、Flink可以支持毫秒级的响应
C、Flink只能支持秒级的响应
D、Flink支持增量迭代,具有对迭代进行自动优化的功能
B.Dhdfs.audit.logger=${HDFS_AUDIT_LOGGER:-INFO}
C.Dhdfs.audit.logger=${HDFS_AUDIT_LOGGER:-INFO,RFAAUDIT}
D.Dhdfs.audit.logger=${YARN_AUDIT_LOGGER:-INFO,RFAAUDIT}
为了保护您的账号安全,请在“简答题”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!