搜题
网友您好,请在下方输入框内输入要搜索的题目:
搜题
题目内容 (请给出正确答案)
提问人:网友154336271 发布时间:2022-10-04
[多选题]

下面关于RDD的描述正确的是()

A.[A]一个RDD就是一个分布式对象集合

B.[B]一个RDD本质上是一个只读的分区记录集合

C.[C]RDD提供了一组丰富的操作以支持常见的数据运算,分为行动(Action)和转换(Transformation)两种类型

D.[D]RDD不适合对于数据集中元素执行相同操作的批处理式应用,而比较适合用于需要异步、细粒度状态的应用

参考答案
简答题官方参考答案 (由简答题聘请的专业题库老师提供的解答)
查看官方参考答案
网友提供的答案
位网友提供了参考答案,
查看全部
  • · 有3位网友选择 B,占比30%
  • · 有3位网友选择 C,占比30%
  • · 有2位网友选择 AC,占比20%
  • · 有2位网友选择 AB,占比20%
匿名网友[18.***.***.213]选择了 C
1天前
匿名网友[175.***.***.219]选择了 AC
1天前
匿名网友[67.***.***.53]选择了 AC
1天前
匿名网友[228.***.***.141]选择了 B
1天前
匿名网友[219.***.***.245]选择了 C
1天前
匿名网友[75.***.***.21]选择了 AB
1天前
匿名网友[53.***.***.95]选择了 AB
1天前
匿名网友[245.***.***.215]选择了 B
1天前
匿名网友[191.***.***.213]选择了 B
1天前
匿名网友[109.***.***.11]选择了 C
1天前
提交我的答案
登录提交答案,可赢取奖励机会。
更多“下面关于RDD的描述正确的是()”相关的问题
第1题
关于RDD分区的作用,下面描述正确的是

A.增加并行度

B.增加时间开销

C.减少通信开销

D.减少并行度

点击查看答案
第2题
下面关于Spark MLlib库的描述正确的是:

A.MLlib库从1.2版本以后分为两个包:spark.mllib和spark.ml

B.spark.mllib包含基于DataFrame的原始算法API

C.spark.mllib包含基于RDD的原始算法API

D.spark.ml则提供了基于RDD的、高层次的API

点击查看答案
第3题
下面关于DataFrame的描述正确的是:

A.DataFrame的推出,让Spark具备了处理大规模结构化数据的能力

B.DataFrame比原有的RDD转化方式更加简单易用,而且获得了更高的计算性能

C.Spark能够轻松实现从MySQL到DataFrame的转化,并且支持SQL查询

D.DataFrame是一种以RDD为基础的分布式数据集,提供了详细的结构信息

点击查看答案
第4题
下面关于RDD的理解错误的是()。

A.RDD是一个容错的、并行的数据结构

B.RDD是一个只读的分区记录集合

C.RDD是可依赖的

D.RDD是可变的

点击查看答案
第5题
下面关于Structured Streaming和Spark SQL、Spark Streaming关系描述正确的是

A、Spark Streaming采用的数据抽象是DStream(本质上就是一系列RDD),而Structured Streaming采用的数据抽象是DataFrame

B、Structured Streaming将Spark SQL和Spark Streaming二者的特性结合起来

C、Structured Streaming可以使用Spark SQL的DataFrame/Dataset来处理数据流,但Spark SQL只能处理静态的数据,而Structured Streaming可以处理结构化的数据流

D、Spark Streaming只能实现秒级的实时响应,而Structured Streaming由于采用了全新的设计方式,采用微批处理模型时可以实现100毫秒级别的实时响应,采用持续处理模型时可以支持毫秒级的实时响应。

点击查看答案
第6题
下列关于 RDD 在 Spark 架构中运行过程的描述,正确的是()

A.SparkContext 负责计算 RDD 之间依赖关系,构建 DAG 。

B.DAGScheduler 负责将 DAG 图分解成多个 Stage ,每个 Stage 中包含多个 Task 。

C.TaskScheduler 负责将每个 Task 分发给各个 Worker 节点。

D.Worker 节点上 Executor 执行相应 Task 。

点击查看答案
第7题
下面描述错误的是:

A、在RDD编程中需要生成一个SparkContext对象

B、在Spark SQL编程中需要生成一个SparkSession对象

C、运行一个Spark Streaming程序,就需要首先生成一个StreamingContext对象

D、在Spark SQL编程中需要生成一个StreamingContext对象

点击查看答案
第8题
以下关于RDD的持久化的描述,正确的是

A.persist(MEMORY_ONLY):表示将RDD作为反序列化的对象存储于JVM中,如果内存不足,就要按照LRU原则替换缓存中的内容

B.persist(MEMORY_AND_DISK):表示将RDD作为反序列化的对象存储在JVM中,如果内存不足,超出的分区将会被存放在硬盘上

C.通过持久化(缓存)机制可以避免重复计算的开销

D.使用cache()方法时,会调用persist(MEMORY_ONLY)

点击查看答案
第9题
关于RDD描述不正确的是()。

A.对各种数据计算模型的统一抽象

B.RDD是一个读、写、分区记录的集合

C.Spark的计算过程主要是RDD的迭代计算过程

D.一个存储数据的数据结构

点击查看答案
第10题
有关RDD描述正确的是()。

A.一组分片是数据集的基本组成单位

B.计算是以分片为单位的

C.RDD的每次转换都会生成一个新的RDD

D.是一个分区的只读记录的集合

点击查看答案
重要提示: 请勿将账号共享给其他人使用,违者账号将被封禁!
查看《购买须知》>>>
重置密码
账号:
旧密码:
新密码:
确认密码:
确认修改
购买搜题卡查看答案
购买前请仔细阅读《购买须知》
请选择支付方式
微信支付
支付宝支付
点击支付即表示你同意并接受《服务协议》《购买须知》
立即支付
搜题卡使用说明

1. 搜题次数扣减规则:

功能 扣减规则
基础费
(查看答案)
加收费
(AI功能)
文字搜题、查看答案 1/每题 0/每次
语音搜题、查看答案 1/每题 2/每次
单题拍照识别、查看答案 1/每题 2/每次
整页拍照识别、查看答案 1/每题 5/每次

备注:网站、APP、小程序均支持文字搜题、查看答案;语音搜题、单题拍照识别、整页拍照识别仅APP、小程序支持。

2. 使用语音搜索、拍照搜索等AI功能需安装APP(或打开微信小程序)。

3. 搜题卡过期将作废,不支持退款,请在有效期内使用完毕。

请使用微信扫码支付(元)

订单号:

遇到问题请联系在线客服

请不要关闭本页面,支付完成后请点击【支付完成】按钮
遇到问题请联系在线客服
恭喜您,购买搜题卡成功 系统为您生成的账号密码如下:
重要提示:请勿将账号共享给其他人使用,违者账号将被封禁。
发送账号到微信 保存账号查看答案
怕账号密码记不住?建议关注微信公众号绑定微信,开通微信扫码登录功能
警告:系统检测到您的账号存在安全风险

为了保护您的账号安全,请在“简答题”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!

- 微信扫码关注简答题 -
警告:系统检测到您的账号存在安全风险
抱歉,您的账号因涉嫌违反简答题购买须知被冻结。您可在“简答题”微信公众号中的“官网服务”-“账号解封申请”申请解封,或联系客服
- 微信扫码关注简答题 -
请用微信扫码测试
欢迎分享答案

为鼓励登录用户提交答案,简答题每个月将会抽取一批参与作答的用户给予奖励,具体奖励活动请关注官方微信公众号:简答题

简答题官方微信公众号

简答题
下载APP
关注公众号
TOP