()是智能体与环境不断交互,从而不断强化自己的决策能力的过程。
A、有监督学习
B、无监督学习
C、强化学习
D、自我学习
A、有监督学习
B、无监督学习
C、强化学习
D、自我学习
A.基于包孕结构的智能体在与环境的交互中基于逻辑推理产生动作
B.采用包孕结构时,智能体在与环境交互中按照优先级高低顺序激活产生输出的规则
C.BDI结构是一种实现“信念-期望-意图”实证推理逻辑的智能体结构
D.采用BDI结构时,智能体可以通过与环境交互可以产生新信念、新期望和新意图
A.在强化学习中,计算机通过不断与环境交互并通过环境反馈来逐渐适应环境
B.强化学习的概念是从Alphago战胜李世石之后才提出的
C.强化学习属于无监督学习的一种,不需要有监督信息
D.强化学习和有监督学习的过程相似,是“开环”的过程
A.强化学习的概念是从Alphago战胜李世石之后才提出的
B.强化学习属于无监督学习的一种,不需要有监督信息
C.强化学习和有监督学习的过程相似,是“开环”的过程
D.在强化学习中,计算机通过不断与环境交互并通过环境反馈来逐渐适应环境
A.为下属制造并不断强化一种权力
B.为下属制造并不断强化一个梦想
C.为下属制造并不断强化一种利益
D.为下属制造并不断强化一种意识
A.为下属制造并不断强化一种权力
B.为下属制造并不断强化一个梦想
C.为下属制造并不断强化一种利益
D.为下属制造并不断强化一种意识
为了保护您的账号安全,请在“简答题”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!