深度学习笔记——权重初始化、评估指标、梯度消失和梯度爆炸 25-01-29 00:23 3278 6397 blog.csdn.net 大家好,这里是好评笔记,公主号:Goodnote,专栏文章私信限时Free。本文介绍深度学习常见的概念——权重初始化、评估指标、梯度消失和梯度爆炸。 文章目录 权重初始化 零初始化 (Zero Initialization) 随机初始化 (Random Initialization) Xavier 初始化(Glorot 初始化) He 初始化 正交初始化(Orthogonal Initialization) 预训练模型初始化 权重初始化方法总结 总结 评估指标 1. 分类问题 混淆矩阵 二分类问题的评估指标 多分类问题的评估指标 宏平均 (Macro Average) 微平均 (Micro Average) 2. 回归问题 总结 梯度消失和梯度爆炸 梯度消失 (Vanishing Gradient) 描述 产生原因 影响 解决方法 梯度爆炸 (Exploding Gradient) 描述 产生原因 影响 解决方法 总结 Transformer中的优化方案 历史文章 机器学习 深度学习 权重初始化 权重初始化是影响模型训练速度和性能的重要因素。合理的权重初始化可以帮助加快收敛,减少不稳定性。以下是几种常见的权重初始化方法及其解释: 零初始化 (Zero Initialization) 描述:将所有权重初始化为零。 优点:简单易实现。 缺点:所有神经元的输出相同,导致每个神经元在反向传播时更新相同的权重,无法有效学习。此方法通常不适用于深度学习。 Goodnote 微信公众号 人工智能|机器学习|深度学习|AIGC|多模态 注:本文转载自blog.csdn.net的好评笔记的文章"https://blog.csdn.net/haopinglianlian/article/details/143835336"。版权归原作者所有,此博客不拥有其著作权,亦不承担相应法律责任。如有侵权,请联系我们删除。 复制链接
大家好,这里是好评笔记,公主号:Goodnote,专栏文章私信限时Free。本文介绍深度学习常见的概念——权重初始化、评估指标、梯度消失和梯度爆炸。 文章目录 权重初始化 零初始化 (Zero Initialization) 随机初始化 (Random Initialization) Xavier 初始化(Glorot 初始化) He 初始化 正交初始化(Orthogonal Initialization) 预训练模型初始化 权重初始化方法总结 总结 评估指标 1. 分类问题 混淆矩阵 二分类问题的评估指标 多分类问题的评估指标 宏平均 (Macro Average) 微平均 (Micro Average) 2. 回归问题 总结 梯度消失和梯度爆炸 梯度消失 (Vanishing Gradient) 描述 产生原因 影响 解决方法 梯度爆炸 (Exploding Gradient) 描述 产生原因 影响 解决方法 总结 Transformer中的优化方案 历史文章 机器学习 深度学习 权重初始化 权重初始化是影响模型训练速度和性能的重要因素。合理的权重初始化可以帮助加快收敛,减少不稳定性。以下是几种常见的权重初始化方法及其解释: 零初始化 (Zero Initialization) 描述:将所有权重初始化为零。 优点:简单易实现。 缺点:所有神经元的输出相同,导致每个神经元在反向传播时更新相同的权重,无法有效学习。此方法通常不适用于深度学习。 Goodnote 微信公众号 人工智能|机器学习|深度学习|AIGC|多模态
评论记录:
回复评论: