题目内容
(请给出正确答案)
提问人:网友陈珊
发布时间:2022-01-07
[多选题]
假设在一个深度学习网络中批处理梯度下降花费了太多的时间来找到一个值的参数值,该值对于成本函数J(W[1],b[1],…,W[L],b[L])来说是很小的值。以下哪些方法可以帮助找到J值较小的参数值()
A.尝试使用Adam算法
B.尝试对权重进行更好的随机初始化
C.尝试调整学习率α
D.尝试mini-batch梯度下降
参考答案
简答题官方参考答案
(由简答题聘请的专业题库老师提供的解答)
查看官方参考答案
网友提供的答案
共位网友提供了参考答案,
查看全部
- · 有4位网友选择 C,占比44.44%
- · 有2位网友选择 BD,占比22.22%
- · 有2位网友选择 BC,占比22.22%
- · 有1位网友选择 ABD,占比11.11%