对于spark框架的说法正确的是()
A.运算速度是HadoopMapReduce的10到100倍
B.容易使用,支持多种语言开发
C.方便部署,可以连接各种数据源
D.不可以进行机器学习
- · 有5位网友选择 C,占比50%
- · 有3位网友选择 D,占比30%
- · 有1位网友选择 ABC,占比10%
- · 有1位网友选择 BC,占比10%
A.运算速度是HadoopMapReduce的10到100倍
B.容易使用,支持多种语言开发
C.方便部署,可以连接各种数据源
D.不可以进行机器学习
A、Scala是Spark的主要编程语言,但Spark还支持Java、Python、R作为编程语言
B、Spark提供了内存计算,可将中间结果放到内存中,对于迭代运算效率更高
C、Spark基于DAG的任务调度执行机制,要优于Hadoop MapReduce的迭代执行机制
D、Spark的计算模式也属于MapReduce,但编程模型比Hadoop MapReduce更灵活
A.分布式机器学习需要依赖Hadoop、Spark等分布式存储和计算框架。
B.分布式机器学习面对的首要问题主要是数据量,而不是速度的问题。
C.对运算速度要求高的机器学习算法可以优先使用Spark计算框架。
D.分布式计算可以在单个常规的服务器上运行。
A.相比Mapreduce,Spark的中间数据放在内存中,对于迭代运算的效率更高
B.Spark支持使用Scala、Java、Python和R语言进行编程
C.RDD可从文件创建或通过对其他RDD执行转换操作而创建
D.窄依赖是划分Stage的依据,遇到窄依赖就划分stage
A.Spark是基于内存的迭代计算框架,适用于需要多次操作特定数据集的应用场合
B.Spark不适用那种异步细粒度更新状态的应用
C.Spark基于非实时数据流的数据处理
D.Spark的适用面比较广泛且比较通用
A.Spark 将中间结果存储在内存中
B.Spark 不是一个分布式计算机框架
C.Spark 支持 Java 语言
D.Spark 需要基于 Hadoop 运行
为了保护您的账号安全,请在“简答题”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!