下面哪个针对MapReduce的说法是错误的?
A.MapReduce是支持分布式机器学习算法的计算框架。
B.MapReduce的运行需要基础的分布式存储系统HDFS支持。
C.MapReduce可以对分布式的大数据分片进行并行的实时分析。
D.MapReduce上的数据分析属于数据并行计算类型。
- · 有3位网友选择 B,占比37.5%
- · 有3位网友选择 D,占比37.5%
- · 有2位网友选择 C,占比25%
A.MapReduce是支持分布式机器学习算法的计算框架。
B.MapReduce的运行需要基础的分布式存储系统HDFS支持。
C.MapReduce可以对分布式的大数据分片进行并行的实时分析。
D.MapReduce上的数据分析属于数据并行计算类型。
A.它们都是支持大数据处理的分布式并行计算框架。
B.它们都可以把大数据转化为小数据,然后分布在集群进行并行分析。
C.它们对机器学习算法的处理方法是一样的。
D.Haoop支持模型并行,Spark支持数据并行。
A.分布式机器学习需要依赖Hadoop、Spark等分布式存储和计算框架。
B.分布式机器学习面对的首要问题主要是数据量,而不是速度的问题。
C.对运算速度要求高的机器学习算法可以优先使用Spark计算框架。
D.分布式计算可以在单个常规的服务器上运行。
A.并行决策树可以对每个属性的重要性分别进行计算。
B.并行k均值算法在map程序中各个数据节点要共享各分组的几何重心(每次迭代产生的“聚类中心”)。
C.常见的机器学习算法可以使用批处理的改造方式实现分布式计算。
D.分布式机器学习利用并行计算可以提升算法的性能。
A、k-均值聚类需要大量的迭代,因此不能使用分布式计算。
B、k-均值的分布式实现需要MapReduce的各个数据节点共享假设的聚类中心。
C、k-均值算法的大量迭代运算在分布式环境下的效率一般更高。
D、k-均值在Spark内存计算框架下运行要比Hadoop MapReduce下运行要快的多。
A.传统的机器学习算法,由于技术和单机存储的限制,大多只能在少量数据上使用
B.利用MapReduce框架在全量数据上进行机器学习,这在一定程度上解决了统计随机性的问题,提高了机器学习的精度
C.MapReduce可以高效支持迭代计算
D.Spark无法高效支持迭代计算
A.多维可视化和图可视化可视化计算的并行化
B.数据挖掘并行化机器学习的应用
C.MapReduce流、图、迭代、查询
D.分布式数据库接口和查询语言分布式文件系统
A.传统机器学习算法大多数不支持数据的批处理。
B.大数据通过合理切分就可以转化为传统机器学习算法容易处理的小数据。
C.传统机器学习的算法在处理大数据时需要通过分布式的改造。
D.传统机器学习通过数据的批处理很容易快速地处理大数据。
为了保护您的账号安全,请在“简答题”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!