搜题
网友您好,请在下方输入框内输入要搜索的题目:
搜题
题目内容 (请给出正确答案)
提问人:网友bacoo_zh 发布时间:2022-01-07
[单选题]

关于策略梯度的方法说法正确的是

A.只适用于离散动作空间

B.适用于连续动作空间

C.策略梯度的方法与DQN中的目标函数一致

D.策略梯度的方法通过Q值挑选动作

参考答案
简答题官方参考答案 (由简答题聘请的专业题库老师提供的解答)
查看官方参考答案
网友提供的答案
位网友提供了参考答案,
查看全部
  • · 有6位网友选择 B,占比66.67%
  • · 有2位网友选择 C,占比22.22%
  • · 有1位网友选择 A,占比11.11%
匿名网友[125.***.***.139]选择了 C
1天前
匿名网友[118.***.***.51]选择了 B
1天前
匿名网友[229.***.***.148]选择了 B
1天前
匿名网友[47.***.***.145]选择了 B
1天前
匿名网友[43.***.***.135]选择了 A
1天前
匿名网友[114.***.***.246]选择了 B
1天前
匿名网友[62.***.***.239]选择了 C
1天前
匿名网友[144.***.***.178]选择了 B
1天前
匿名网友[238.***.***.153]选择了 B
1天前
提交我的答案
登录提交答案,可赢取奖励机会。
更多“关于策略梯度的方法说法正确的是”相关的问题
第1题
下列关于学习策略的特点说法正确的是()
A.学习策略是学习者为完成学习目标而积极主动使用的,具有较强的目的性和自觉性,学习策略总是与学习效果和效率紧密相连

B.学习策略是学习者制定的学习计划或方案,由大量的规则、技能和方法步骤构成,可以是学习的思路与方法,也可以是具体的活动或技巧

C.在学习过程中,学习策略的主要作用是对学习者学习活动进行自我调节和控制,需要学习者具备一定的元认知能力,与此同时,学习策略对学习活动进行调节和控制又是以学习者的认知策略为支撑的,是通过学习方法的调用来实现的

D.学习策略的种类繁多,不同的学习策略针对的任务不同,但对学习目标的达成作用几乎相同,使用的范围和程序也基本相同

点击查看答案
第2题
直观判断法是指通过调查、征求意见、综合分析和判断来选择供应商的一种方法,是一种主观性较强的判断方法。
点击查看答案
第3题
下列关于风险管理策略的说法,正确的是()。
A、不要将所有的鸡蛋放在一个篮子里隐含的是风险转移的思想

B、风险分散策略的成本主要是分散投资过程中增加的各项交易费用

C、风险对冲的局限性在于其是一种消极的风险管理策略

D、风险补偿是一种事后的损失补偿策略D、要创建学习型组织

点击查看答案
第4题
关于农产品促销策略的选择说法正确的是()。

A. 使用价格策略,选定合适价格

B. 选择适宜的推销技巧

C. 迎合消费者的购买心理

D. 分析消费者的购物习惯

点击查看答案
第5题
关于“促销策略”的下列说法中不正确的是( )。
A.“促销策略”分为推式策略和拉式策略

B.拉式策略是企业运用非人员推销方式把顾客拉过来,使其对本企业的产品产生需求以扩大销售

C.推式策略是企业运用网络营销的方式把产品推向市场

D.推式策略和拉式策略虽然策略不同,目标却是相同的

点击查看答案
第6题
关于认知风格的教学策略,下列说法不正确的是()。
A.匹配策略对知识的获得直接有利

B.失配策略在一开始往往会在一定程度上影响知识的获得

C.匹配策略可以弥补学习方式上的欠缺

D.失配策略可以弥补学习方式上的欠缺

点击查看答案
第7题
Sarsa与Q-learning的区别是?

A、Sarsa是off-policy,而Q-learning是on-policy

B、Sarsa是on-policy,而Q-learning是off-policy

C、Q-learning在算法更新时,对应的下一个动作并没有执行,而sarsa的下一个动作在这次更新时已经确定了

D、Q-learning是一种保守的算法,sarsa是一种贪婪勇敢的算法

点击查看答案
第8题
以下关于蒙特卡洛方法描述正确的是

A、蒙特卡洛方法计算值函数可以采用First-visit方法

B、蒙特卡洛方法方差很大

C、蒙特卡洛方法计算值函数可以采用Every-visit 方法

D、蒙特卡洛方法偏差很大

点击查看答案
第9题
Q-learning与Sarsa相同的地方是

A、都使用了等策略进行探索

B、都用q-table存储状态动作对

C、更新公式相同

D、两者都可以找到最优的策略

点击查看答案
第10题
关于DQN说法正确的是

A、网络最开始使用卷积神经网络或全连接网络,目的是为了提取图像特征信息

B、对于atari游戏中,一般将连续4帧图像放在一起作为一个state送到神经网络中

C、网络的输出是动作

D、网络的输出是Q值

点击查看答案
重要提示: 请勿将账号共享给其他人使用,违者账号将被封禁!
查看《购买须知》>>>
重置密码
账号:
旧密码:
新密码:
确认密码:
确认修改
购买搜题卡查看答案
购买前请仔细阅读《购买须知》
请选择支付方式
微信支付
支付宝支付
点击支付即表示你同意并接受《服务协议》《购买须知》
立即支付
搜题卡使用说明

1. 搜题次数扣减规则:

功能 扣减规则
基础费
(查看答案)
加收费
(AI功能)
文字搜题、查看答案 1/每题 0/每次
语音搜题、查看答案 1/每题 2/每次
单题拍照识别、查看答案 1/每题 2/每次
整页拍照识别、查看答案 1/每题 5/每次

备注:网站、APP、小程序均支持文字搜题、查看答案;语音搜题、单题拍照识别、整页拍照识别仅APP、小程序支持。

2. 使用语音搜索、拍照搜索等AI功能需安装APP(或打开微信小程序)。

3. 搜题卡过期将作废,不支持退款,请在有效期内使用完毕。

请使用微信扫码支付(元)

订单号:

遇到问题请联系在线客服

请不要关闭本页面,支付完成后请点击【支付完成】按钮
遇到问题请联系在线客服
恭喜您,购买搜题卡成功 系统为您生成的账号密码如下:
重要提示:请勿将账号共享给其他人使用,违者账号将被封禁。
发送账号到微信 保存账号查看答案
怕账号密码记不住?建议关注微信公众号绑定微信,开通微信扫码登录功能
警告:系统检测到您的账号存在安全风险

为了保护您的账号安全,请在“简答题”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!

- 微信扫码关注简答题 -
警告:系统检测到您的账号存在安全风险
抱歉,您的账号因涉嫌违反简答题购买须知被冻结。您可在“简答题”微信公众号中的“官网服务”-“账号解封申请”申请解封,或联系客服
- 微信扫码关注简答题 -
请用微信扫码测试
欢迎分享答案

为鼓励登录用户提交答案,简答题每个月将会抽取一批参与作答的用户给予奖励,具体奖励活动请关注官方微信公众号:简答题

简答题官方微信公众号

简答题
下载APP
关注公众号
TOP