题目内容 (请给出正确答案) 提问人:网友jellongd 发布时间:2022-01-07 [主观题] 强化学习的基本框架中,智能体通过()与环境进行交互时,环境会返给智能体一个当前的()。 简答题官方参考答案 (由简答题聘请的专业题库老师提供的解答) 查看官方参考答案