下列关于强化学习的说法正确的是()。
A.强化学习的概念是从Alphago战胜李世石之后才提出的
B.强化学习属于无监督学习的一种,不需要有监督信息
C.强化学习和有监督学习的过程相似,是“开环”的过程
D.在强化学习中,计算机通过不断与环境交互并通过环境反馈来逐渐适应环境
- · 有4位网友选择 D,占比40%
- · 有3位网友选择 B,占比30%
- · 有2位网友选择 C,占比20%
- · 有1位网友选择 A,占比10%
A.强化学习的概念是从Alphago战胜李世石之后才提出的
B.强化学习属于无监督学习的一种,不需要有监督信息
C.强化学习和有监督学习的过程相似,是“开环”的过程
D.在强化学习中,计算机通过不断与环境交互并通过环境反馈来逐渐适应环境
A.在强化学习中,计算机通过不断与环境交互并通过环境反馈来逐渐适应环境
B.强化学习的概念是从Alphago战胜李世石之后才提出的
C.强化学习属于无监督学习的一种,不需要有监督信息
D.强化学习和有监督学习的过程相似,是“开环”的过程
A.无监督学习和强化学习
B.监督学习和强化学习
C.半监督学习和强化学习
D.强化学习
A.通过一定的榜样来强化相应的学习行为或学习行为倾向的是替代强化
B.强化的实质就是惩罚
C.直接强化属于内部动机
D.正强化的原理常常被用来激励人们努力地学习
A.强化学习与监督学习没有区别
B.强化学习认为,计算机单纯通过感知环境,与环境交互,并且从交互中获得评价反馈,就可以适应所处的环境
C.强化学习的整个过程形成一个“闭环”
D.与无监督学习相比,强化学习中环境所提供的“奖励”实际上就是监督信号
A.Policy based的强化学习类型要明显优于Value based和Action based的方法
B.强化学习中的Agent有明确的目标用于指导自己的行为
C.Agent的模型参数是根据环境的反馈来更新
D.强化学习被广泛应用在自动驾驶、电子竞技和AI游戏中
为了保护您的账号安全,请在“简答题”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!