基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
由于训练数据来源的多样化,难以通过学习得到最优的模型参数,因此提出了一种基于多模板隐马尔可夫模型的文本信息抽取算法.该算法首先利用文本排版格式和分隔符等信息,对文本进行分块;然后在分块的基础上,对训练数据进行聚类以形成多个形式的模板(多模板),并对多模板数据训练得到隐马尔可夫初始概率及转移概率参数;最后,用被训练的数据统一训练释放概率参数,结合初始概率、转移概率以及释放概率参数对文本信息进行抽取.实验结果表明,该算法在精确度和召回率指标上比简单隐马尔可夫模型具有更好的性能.
推荐文章
基于主动学习隐马尔可夫模型的文本信息抽取
主动学习
隐马尔可夫模型
文本信息抽取
基于模拟退火算法和隐马尔可夫模型的文本信息抽取
文本信息抽取
改进的模拟退火算法
二阶隐马尔可夫模型
基于隐马尔可夫模型的中文文本事件信息抽取
隐马尔可夫模型
事件信息抽取
触发词
事件要素
基于多模板隐马尔可夫模型的文本信息抽取算法
信息抽取
隐马尔可夫模型
多模板
聚类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多模板隐马尔可夫模型的文本信息抽取算法
来源期刊 计算机应用 学科 工学
关键词 文本信息抽取 隐马尔可夫模型 多模板 文本分块
年,卷(期) 2008,(3) 所属期刊栏目 人工智能
研究方向 页码范围 699-702
页数 4页 分类号 TP18|TP391.1
字数 4799字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 胡宇舟 天津大学管理学院 6 105 3.0 6.0
2 顾学道 4 28 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (87)
参考文献  (8)
节点文献
引证文献  (19)
同被引文献  (21)
二级引证文献  (94)
1989(2)
  • 参考文献(1)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(3)
  • 参考文献(3)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2009(3)
  • 引证文献(3)
  • 二级引证文献(0)
2010(9)
  • 引证文献(5)
  • 二级引证文献(4)
2011(11)
  • 引证文献(3)
  • 二级引证文献(8)
2012(21)
  • 引证文献(2)
  • 二级引证文献(19)
2013(14)
  • 引证文献(1)
  • 二级引证文献(13)
2014(12)
  • 引证文献(1)
  • 二级引证文献(11)
2015(7)
  • 引证文献(0)
  • 二级引证文献(7)
2016(12)
  • 引证文献(1)
  • 二级引证文献(11)
2017(9)
  • 引证文献(2)
  • 二级引证文献(7)
2018(6)
  • 引证文献(1)
  • 二级引证文献(5)
2019(7)
  • 引证文献(0)
  • 二级引证文献(7)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
文本信息抽取
隐马尔可夫模型
多模板
文本分块
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
相关基金
湖南省自然科学基金
英文译名:Natural Science Foundation of Hunan Province
官方网址:http://jj.hnst.gov.cn/
项目类型:一般面上项目
学科类型:
福建省青年科技人才创新基金
英文译名:
官方网址:
项目类型:申报项目有农业、环保、机电、海洋、生物、新材料等10多种
学科类型:
论文1v1指导