LR不使用MSE而使用交叉熵损失函数的原因
区块链毕设网qklbishe.com为您提供问题的解答
LR不使用MSE而使用交叉熵损失函数的原因
主要考虑CE和MSE的梯度更新公式,MSE的参数更新公式中,有sigmod导数的乘项,而sigmod在输入很大或很小时,导数趋近于0,所以即使此时loss很大,梯度也很小,导致LR收敛很慢。 而使用CE loss时,参数更新时为(sigmod(z)-y)loss 越大 梯度越大,加快收敛速度。
29:50
以上就是关于问题LR不使用MSE而使用交叉熵损失函数的原因的答案
欢迎关注区块链毕设网-
专业区块链毕业设计成品源码,定制。
区块链NFT链游项目方科学家脚本开发培训