网友您好，请在下方输入框内输入要搜索的题目：

搜题

题目内容（请给出正确答案）

提问人：网友154336271 发布时间：2022-10-04

[多选题]

下面关于RDD的描述正确的是（）

A.[A]一个RDD就是一个分布式对象集合

B.[B]一个RDD本质上是一个只读的分区记录集合

C.[C]RDD提供了一组丰富的操作以支持常见的数据运算，分为行动（Action）和转换（Transformation）两种类型

D.[D]RDD不适合对于数据集中元素执行相同操作的批处理式应用，而比较适合用于需要异步、细粒度状态的应用

参考答案

简答题官方参考答案（由简答题聘请的专业题库老师提供的解答）

查看官方参考答案

网友提供的答案

共位网友提供了参考答案，

查看全部

· 有3位网友选择 B，占比30%
· 有3位网友选择 C，占比30%
· 有2位网友选择 AC，占比20%
· 有2位网友选择 AB，占比20%

ABCD

提交我的答案

登录提交答案，可赢取奖励机会。登录

更多“下面关于RDD的描述正确的是（）”相关的问题

第1题

关于RDD分区的作用，下面描述正确的是

A.增加并行度

B.增加时间开销

C.减少通信开销

D.减少并行度

点击查看答案

第2题

下面关于Spark MLlib库的描述正确的是：

A.MLlib库从1.2版本以后分为两个包：spark.mllib和spark.ml

B.spark.mllib包含基于DataFrame的原始算法API

C.spark.mllib包含基于RDD的原始算法API

D.spark.ml则提供了基于RDD的、高层次的API

点击查看答案

第3题

下面关于DataFrame的描述正确的是：

A.DataFrame的推出，让Spark具备了处理大规模结构化数据的能力

B.DataFrame比原有的RDD转化方式更加简单易用，而且获得了更高的计算性能

C.Spark能够轻松实现从MySQL到DataFrame的转化，并且支持SQL查询

D.DataFrame是一种以RDD为基础的分布式数据集，提供了详细的结构信息

点击查看答案

第4题

下面关于RDD的理解错误的是（)。

A.RDD是一个容错的、并行的数据结构

B.RDD是一个只读的分区记录集合

C.RDD是可依赖的

D.RDD是可变的

点击查看答案

第5题

下面关于Structured Streaming和Spark SQL、Spark Streaming关系描述正确的是

A、Spark Streaming采用的数据抽象是DStream（本质上就是一系列RDD），而Structured Streaming采用的数据抽象是DataFrame

B、Structured Streaming将Spark SQL和Spark Streaming二者的特性结合起来

C、Structured Streaming可以使用Spark SQL的DataFrame/Dataset来处理数据流，但Spark SQL只能处理静态的数据，而Structured Streaming可以处理结构化的数据流

D、Spark Streaming只能实现秒级的实时响应，而Structured Streaming由于采用了全新的设计方式，采用微批处理模型时可以实现100毫秒级别的实时响应，采用持续处理模型时可以支持毫秒级的实时响应。

点击查看答案

第6题

下列关于 RDD 在 Spark 架构中运行过程的描述,正确的是（）

A.SparkContext 负责计算 RDD 之间依赖关系，构建 DAG 。

B.DAGScheduler 负责将 DAG 图分解成多个 Stage ，每个 Stage 中包含多个 Task 。

C.TaskScheduler 负责将每个 Task 分发给各个 Worker 节点。

D.Worker 节点上 Executor 执行相应 Task 。

点击查看答案

第7题

下面描述错误的是：

A、在RDD编程中需要生成一个SparkContext对象

B、在Spark SQL编程中需要生成一个SparkSession对象

C、运行一个Spark Streaming程序，就需要首先生成一个StreamingContext对象

D、在Spark SQL编程中需要生成一个StreamingContext对象

点击查看答案

第8题

以下关于RDD的持久化的描述，正确的是

A.persist(MEMORY_ONLY)：表示将RDD作为反序列化的对象存储于JVM中，如果内存不足，就要按照LRU原则替换缓存中的内容

B.persist(MEMORY_AND_DISK)：表示将RDD作为反序列化的对象存储在JVM中，如果内存不足，超出的分区将会被存放在硬盘上

C.通过持久化（缓存）机制可以避免重复计算的开销

D.使用cache()方法时，会调用persist(MEMORY_ONLY)

点击查看答案

第9题

关于RDD描述不正确的是（)。

A.对各种数据计算模型的统一抽象

B.RDD是一个读、写、分区记录的集合

C.Spark的计算过程主要是RDD的迭代计算过程

D.一个存储数据的数据结构

点击查看答案

第10题

有关RDD描述正确的是（)。

A.一组分片是数据集的基本组成单位

B.计算是以分片为单位的

C.RDD的每次转换都会生成一个新的RDD

D.是一个分区的只读记录的集合

点击查看答案

账号：尚未登录

登录没有账号？去注册

购买搜题卡

考试指南全部 >

2024年自考什么时候报名考哪些内容 2024年本科自考报考时间考哪些内容 2024年自考本科在哪里报名报考条件有哪些 2024年自考和成教含金量哪个高一些有哪些不同 2024年自学考试专升本成绩什么时候出结果 2024自考本科的成绩什么时候出怎么查 2024年4月自考成绩什么时候出来 2024年10月成人自考大专全国统一考试时间安排 2024年4月自学考试的成绩在哪可以查到什么时候公布浙江大专生怎么自考本科需要什么条件

购买搜题卡查看答案

购买前请仔细阅读《购买须知》

请选择支付方式

微信支付

支付宝支付

点击支付即表示你同意并接受《服务协议》和《购买须知》

立即支付已付款，但不能查看答案，请点这里登录即可>>

搜题卡使用说明

1. 搜题次数扣减规则：

功能	扣减规则
功能	基础费（查看答案）	加收费（AI功能）
文字搜题、查看答案	1/每题	0/每次
语音搜题、查看答案	1/每题	2/每次
单题拍照识别、查看答案	1/每题	2/每次
整页拍照识别、查看答案	1/每题	5/每次

备注：网站、APP、小程序均支持文字搜题、查看答案；语音搜题、单题拍照识别、整页拍照识别仅APP、小程序支持。

2. 使用语音搜索、拍照搜索等AI功能需安装APP（或打开微信小程序）。

3. 搜题卡过期将作废，不支持退款，请在有效期内使用完毕。

找回账号密码

联系在线客服

警告：系统检测到您的账号存在安全风险

为了保护您的账号安全，请在“简答题”公众号进行验证，点击“官网服务”-“账号验证”后输入验证码“”完成验证，验证成功后方可继续查看答案！

- 微信扫码关注简答题 -

警告：系统检测到您的账号存在安全风险

抱歉，您的账号因涉嫌违反简答题购买须知被冻结。您可在“简答题”微信公众号中的“官网服务”-“账号解封申请”申请解封，或联系客服。

- 微信扫码关注简答题 -

下载APP

关注公众号

TOP