首页 最新 热门 推荐

  • 首页
  • 最新
  • 热门
  • 推荐

梯度提升分类树损失函数化简过程

  • 25-02-16 05:20
  • 2660
  • 6411
blog.csdn.net

文章目录

        • 损失函数:
        • 推导过程
        • 结论如下

梯度提升分类树损失函数化简过程

损失函数:
  • 定义交叉熵为函数 ψ ( y , F ( x ) ) \psi(y,F(x)) ψ(y,F(x))

  • ψ ( y , F ( x ) ) = − y l n ( p ) − ( 1 − y ) l n ( 1 − p ) \psi(y,F(x)) = -yln(p) - (1-y)ln(1-p) ψ(y,F(x))=−yln(p)−(1−y)ln(1−p)

    • 其中 p = 1 1 + e x p ( − F ( x ) ) p = \frac{1}{1 + exp(-F(x))} p=1+exp(−F(x))1​​ ,即sigmoid函数
    • F ( x ) F(x) F(x)​​​​ 表示决策回归树 DecisionTreeRegressor F(x) 表示每一轮决策树的value,即负梯度
推导过程

将 p = 1 1 + e x p ( − F ( x ) ) p = \frac{1}{1 + exp(-F(x))} p=1+exp(−F(x))1​​​ 带入上面损失方程

ψ ( y , F ( x ) ) = − y l n ( p ) − ( 1 − y ) l n ( 1 − p ) = − y l n 1 1 + e x p ( − F ( x ) ) − ( 1 − y ) l n ( 1 − 1 1 + e x p ( − F ( x ) ) ) = − y l n ( 1 + e x p ( − F ( x ) ) ) − 1 − ( 1 − y ) l n e x p ( − F ( x ) ) 1 + e x p ( − F ( x ) ) = y l n ( 1 + e x p ( − F ( x ) ) ) − ( 1 − y ) ( − F ( x ) − l n ( 1 + e x p ( − F ( x ) ) ) ) = y l n ( 1 + e x p ( − F ( x ) ) ) + ( 1 − y ) ( F ( x ) + l n ( 1 + e x p ( − F ( x ) ) ) ) = F ( x ) + l n ( 1 + e x p ( − F ( x ) ) ) − y F ( x ) = F ( x ) + l n 1 + e x p ( F ( x ) ) e x p ( F ( x ) ) − y F ( x ) = F ( x ) + l n ( 1 + e x p ( F ( x ) ) ) − F ( x ) − y F ( x ) = − y F ( x ) + l n ( 1 + e x p ( F ( x ) ) )

ψ(y,F(x))=−yln(p)−(1−y)ln(1−p)=−yln11+exp(−F(x))−(1−y)ln(1−11+exp(−F(x)))=−yln(1+exp(−F(x)))−1−(1−y)lnexp(−F(x))1+exp(−F(x))=yln(1+exp(−F(x)))−(1−y)(−F(x)−ln(1+exp(−F(x))))=yln(1+exp(−F(x)))+(1−y)(F(x)+ln(1+exp(−F(x))))=F(x)+ln(1+exp(−F(x)))−yF(x)=F(x)+ln1+exp(F(x))exp(F(x))−yF(x)=F(x)+ln(1+exp(F(x)))−F(x)−yF(x)=−yF(x)+ln(1+exp(F(x)))ψ(y,F(x))=−yln(p)−(1−y)ln(1−p)=−yln11+exp(−F(x))−(1−y)ln(1−11+exp(−F(x)))=−yln(1+exp(−F(x)))−1−(1−y)lnexp(−F(x))1+exp(−F(x))=yln(1+exp(−F(x)))−(1−y)(−F(x)−ln(1+exp(−F(x))))=yln(1+exp(−F(x)))+(1−y)(F(x)+ln(1+exp(−F(x))))=F(x)+ln(1+exp(−F(x)))−yF(x)=F(x)+ln1+exp(F(x))exp(F(x))−yF(x)=F(x)+ln(1+exp(F(x)))−F(x)−yF(x)=−yF(x)+ln(1+exp(F(x)))
ψ(y,F(x))​=−yln(p)−(1−y)ln(1−p)=−yln1+exp(−F(x))1​−(1−y)ln(1−1+exp(−F(x))1​)=−yln(1+exp(−F(x)))−1−(1−y)ln1+exp(−F(x))exp(−F(x))​=yln(1+exp(−F(x)))−(1−y)(−F(x)−ln(1+exp(−F(x))))=yln(1+exp(−F(x)))+(1−y)(F(x)+ln(1+exp(−F(x))))=F(x)+ln(1+exp(−F(x)))−yF(x)=F(x)+lnexp(F(x))1+exp(F(x))​−yF(x)=F(x)+ln(1+exp(F(x)))−F(x)−yF(x)=−yF(x)+ln(1+exp(F(x)))​

结论如下
  • 定义梯度提升分类树交叉熵为函数 ψ ( y , F ( x ) ) \psi(y,F(x)) ψ(y,F(x))

  • ψ ( y , F ( x ) ) = − y l n ( p ) − ( 1 − y ) l n ( 1 − p ) \psi(y,F(x)) = -yln(p) - (1-y)ln(1-p) ψ(y,F(x))=−yln(p)−(1−y)ln(1−p)

  • 其中 p = 1 1 + e x p ( − F ( x ) ) p = \frac{1}{1 + exp(-F(x))} p=1+exp(−F(x))1​​ ,即sigmoid函数

  • 化简可得:

    ψ ( y , F ( x ) ) = − y F ( x ) + l n ( 1 + e x p ( F ( x ) ) ) \psi(y,F(x)) = -yF(x) + ln(1 + exp(F(x))) ψ(y,F(x))=−yF(x)+ln(1+exp(F(x)))

欢迎你加入,深入学习~

代码点亮人生,思维改变世界~

注:本文转载自blog.csdn.net的MathDance的文章"https://blog.csdn.net/Soft_Po/article/details/119208209"。版权归原作者所有,此博客不拥有其著作权,亦不承担相应法律责任。如有侵权,请联系我们删除。
复制链接
复制链接
相关推荐
发表评论
登录后才能发表评论和回复 注册

/ 登录

评论记录:

未查询到任何数据!
回复评论:

分类栏目

后端 (14832) 前端 (14280) 移动开发 (3760) 编程语言 (3851) Java (3904) Python (3298) 人工智能 (10119) AIGC (2810) 大数据 (3499) 数据库 (3945) 数据结构与算法 (3757) 音视频 (2669) 云原生 (3145) 云平台 (2965) 前沿技术 (2993) 开源 (2160) 小程序 (2860) 运维 (2533) 服务器 (2698) 操作系统 (2325) 硬件开发 (2492) 嵌入式 (2955) 微软技术 (2769) 软件工程 (2056) 测试 (2865) 网络空间安全 (2948) 网络与通信 (2797) 用户体验设计 (2592) 学习和成长 (2593) 搜索 (2744) 开发工具 (7108) 游戏 (2829) HarmonyOS (2935) 区块链 (2782) 数学 (3112) 3C硬件 (2759) 资讯 (2909) Android (4709) iOS (1850) 代码人生 (3043) 阅读 (2841)

热门文章

101
推荐
关于我们 隐私政策 免责声明 联系我们
Copyright © 2020-2025 蚁人论坛 (iYenn.com) All Rights Reserved.
Scroll to Top