基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
信息抽取中,同-token在文本中可能出现多次,且token多次出现的位置通常相隔很远,传统线性链CRF模型由于Markov假设不能表达长距离依赖关系于是将多次出现的同-token分开标注,丧失了全局信息.提出了长距离依赖条件随机域模型,该模型能结合多次出现的同-token各处的特征,对其进行联合标注.由于长距离依赖使得精确的标注算法不可计算,采用了TRP估计算法.实验表明该模型抽取性能优于线性链CRF模型,尤其是speaker域上的召回率有了很大的提高.
推荐文章
基于条件随机场的科研论文信息分层抽取
信息抽取
条件随机场
分层
基于条件随机域的Web信息抽取
条件随机域
信息抽取
网页文档
拟牛顿法
基于条件随机场的人物信息抽取
CRFs
人物
人物信息
信息抽取
应用粒子群优化-条件随机域的文本生物实体识别
条件随机域模型
粒子群优化
粒子群聚集度
对数似然相对变化率
生物实体识别
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于长距离依赖条件随机域的文本信息抽取
来源期刊 计算机应用与软件 学科 工学
关键词 长距离依赖 条件随机域 线性链 同-token 文本
年,卷(期) 2011,(5) 所属期刊栏目 应用技术与研究
研究方向 页码范围 203-205
页数 分类号 TP391.1
字数 3060字 语种 中文
DOI 10.3969/j.issn.1000-386X.2011.05.059
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 肖基毅 南华大学计算机科学与技术学院 43 178 7.0 11.0
2 朱道辉 南华大学计算机科学与技术学院 2 8 2.0 2.0
3 程阳 广西师范大学生命科学学院 2 8 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (94)
参考文献  (3)
节点文献
引证文献  (5)
同被引文献  (21)
二级引证文献  (0)
1989(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
长距离依赖
条件随机域
线性链
同-token
文本
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
总被引数(次)
101489
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导