首页 最新 热门 推荐

  • 首页
  • 最新
  • 热门
  • 推荐

概率图模型(1):CRF(conditional random field)线性条件随机场

  • 25-03-03 17:41
  • 2056
  • 12311
blog.csdn.net

文章目录

  • 概率图模型的综合叙述:
  • CRF 综述

概率图模型的综合叙述:

[外链图片转存失败(img-zJmo4q79-1567127625649)(https://raw.githubusercontent.com/ZhouziqunZZQZZQ/picBed/master/20190830090141.png)]

特征函数便是图中的conditional。对图简单的说明,综合概述Naive Bayes,Logistic Regression,HMM,Linear-chain CRF之间的关系。Naive Bayes经过条件参数的加入即为Logistic Regression,同时这两者经过序列化即特征函数加入了对相邻状态之间的判断即变为HMM和Linear-chain CRF,最后经过广义图模型的扩展变为最后两者。

CRF 综述

CRF(conditional random field)简单而又直白的讲,线性条件随机场,是只考虑概率图中相邻变量是否满足特征函数 F ( y , x ) F(y,x) F(y,x)的一个模型。

下面看一个词性标注任务的例子:

[外链图片转存失败(img-hTN9nJAg-1567127625650)(https://raw.githubusercontent.com/ZhouziqunZZQZZQ/picBed/master/20190829232219.png)]

定义转移特征函数: t ( y 2 = v . , y 3 = v . , x , i ) = − 1 t(y_2=v.,y_3=v.,x,i)=-1 t(y2​=v.,y3​=v.,x,i)=−1(两个动词相连我们可以给负分)(y2y3都是动词的时候扣分)

定义状态特征函数: s ( y 3 = a r t ⋅ , x , i ) = 1 s\left(y_{3}=a r t_{\cdot}, x, i\right)=1 s(y3​=art⋅​,x,i)=1(把 a 标注成不定冠词可以给正分)(y3是不定冠词的时候加分)

条件随机场的参数化定义为:
P ( y ∣ x ) = 1 Z ( x ) exp ⁡ ( ∑ i , k λ k t k ( y i − 1 , y i , x , i ) + ∑ i , l μ l s l ( y i , x , i ) ) Z ( x ) = ∑ y exp ⁡ ( ∑ i , k λ k t k ( y i − 1 , y i , x , i ) + ∑ i , l μ l s l ( y i , x , i ) )

P(y|x)=1Z(x)exp(∑i,kλktk(yi−1,yi,x,i)+∑i,lμlsl(yi,x,i))Z(x)=∑yexp(∑i,kλktk(yi−1,yi,x,i)+∑i,lμlsl(yi,x,i))P(y|x)=1Z(x)exp⁡(∑i,kλktk(yi−1,yi,x,i)+∑i,lμlsl(yi,x,i))Z(x)=∑yexp⁡(∑i,kλktk(yi−1,yi,x,i)+∑i,lμlsl(yi,x,i))
P(y∣x)=Z(x)1​exp(∑i,k​λk​tk​(yi−1​,yi​,x,i)+∑i,l​μl​sl​(yi​,x,i))Z(x)=∑y​exp(∑i,k​λk​tk​(yi−1​,yi​,x,i)+∑i,l​μl​sl​(yi​,x,i))​
每一项的含义:

∑ i , k λ k t k ( y i − 1 , y i , x , i ) \sum_{i, k} \lambda_{k} t_{k}\left(y_{i-1}, y_{i}, x, i\right) ∑i,k​λk​tk​(yi−1​,yi​,x,i)共计 k k k个转移特征函数条件下每一个函数针对不同的输入位置 i i i给出的评分总和。

∑ i , l μ l s l ( y i , x , i ) ) \sum_{i, l} \mu_{l} s_{l}\left(y_{i}, x, i\right)) ∑i,l​μl​sl​(yi​,x,i))共计 l l l个状态特征函数条件下每一个函数针对不同的输入位置 i i i给出的评分总和。

简化表达

当我们给每个特征函数(转移特征和状态特征)不同的权重 w w w(转移特征的权重 λ k \lambda_{k} λk​与状态特征的权重 μ l \mu_{l} μl​统一用 w w w表示),把转移特征 t ( y i − 1 , y i , x , i ) t\left(y_{i-1}, y_{i}, x, i\right) t(yi−1​,yi​,x,i)和状态特征 s ( y i , x , i ) s\left(y_{i}, x, i\right) s(yi​,x,i)同一写成 F ( y , x ) F(y,x) F(y,x)后:

P w ( y ∣ x ) = 1 Z W ( x ) exp ⁡ ( w ⋅ F ( y , x ) ) P_{w}(y | x)=\frac{1}{Z_{W}(x)} \exp (w \cdot F(y, x)) Pw​(y∣x)=ZW​(x)1​exp(w⋅F(y,x))
Z w ( x ) = ∑ y exp ⁡ ( w ⋅ F ( y , x ) ) Z_{w}(x)=\sum_{y} \exp (w \cdot F(y, x)) Zw​(x)=∑y​exp(w⋅F(y,x))

理解:

满足特征条件越多越容易出现更高的概率,条件随机场模型在统计语料库中相邻词是否满足特征函数的频数,并依此给出 P w ( y ∣ x ) P_{w}(y | x) Pw​(y∣x)。在给定的 ( x , y ) (x,y) (x,y),满足的特征函数越多,模型 P w ( y ∣ x ) P_{w}(y | x) Pw​(y∣x)认为越大。

注:本文转载自blog.csdn.net的呆呆象呆呆的文章"https://blog.csdn.net/qq_41554005/article/details/100150479"。版权归原作者所有,此博客不拥有其著作权,亦不承担相应法律责任。如有侵权,请联系我们删除。
复制链接
复制链接
相关推荐
发表评论
登录后才能发表评论和回复 注册

/ 登录

评论记录:

未查询到任何数据!
回复评论:

分类栏目

后端 (14832) 前端 (14280) 移动开发 (3760) 编程语言 (3851) Java (3904) Python (3298) 人工智能 (10119) AIGC (2810) 大数据 (3499) 数据库 (3945) 数据结构与算法 (3757) 音视频 (2669) 云原生 (3145) 云平台 (2965) 前沿技术 (2993) 开源 (2160) 小程序 (2860) 运维 (2533) 服务器 (2698) 操作系统 (2325) 硬件开发 (2491) 嵌入式 (2955) 微软技术 (2769) 软件工程 (2056) 测试 (2865) 网络空间安全 (2948) 网络与通信 (2797) 用户体验设计 (2592) 学习和成长 (2593) 搜索 (2744) 开发工具 (7108) 游戏 (2829) HarmonyOS (2935) 区块链 (2782) 数学 (3112) 3C硬件 (2759) 资讯 (2909) Android (4709) iOS (1850) 代码人生 (3043) 阅读 (2841)

热门文章

101
推荐
关于我们 隐私政策 免责声明 联系我们
Copyright © 2020-2025 蚁人论坛 (iYenn.com) All Rights Reserved.
Scroll to Top