基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着大量的科研论文以电子文档的形式出现, 为了高效地检索这些科研文献资料,从中精确地抽取这些论文头部的元数据信息显得十分有必要.在条件随机场模型的基础上,提出了一种启发式搜索算法来对论文头部的元数据信息进行提取.该算法首先利用文本分块技术和特征提取规则来对文本进行预处理,然后结合条件随机场概率模型利用启发式搜索来进行元数据的提取.实验结果表明,在相同概率模型的基础上,该算法有着较好的性能,在精确度和召回率方面都有了明显的提高.
推荐文章
一种基于状态空间的启发式搜索算法及其实现
启发式算法
A-Star算法
状态空间
估价函数
一种基于启发式搜索的视差匹配的快速算法
立体图像
视差估计
启发式搜索
一种新型启发式搜索算法研究
蚁群算法
信息素
无人机
航路规划
图像边缘提取的启发式搜索算法
边缘提取
分段自增强
启发式搜索
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于启发式搜索的论文元数据提取算法
来源期刊 计算机应用与软件 学科 工学
关键词 信息提取 元数据提取 条件随机场 文本分块 启发式搜索
年,卷(期) 2009,(9) 所属期刊栏目 基金项目论文
研究方向 页码范围 86-88,94
页数 4页 分类号 TP3
字数 4037字 语种 中文
DOI 10.3969/j.issn.1000-386X.2009.09.027
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张付志 燕山大学信息科学与工程学院 54 475 12.0 19.0
2 侯娜 燕山大学信息科学与工程学院 1 2 1.0 1.0
3 刘慧 燕山大学信息科学与工程学院 2 7 2.0 2.0
4 马玉静 燕山大学信息科学与工程学院 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (9)
共引文献  (162)
参考文献  (4)
节点文献
引证文献  (2)
同被引文献  (6)
二级引证文献  (2)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(3)
  • 参考文献(2)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
信息提取
元数据提取
条件随机场
文本分块
启发式搜索
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
总被引数(次)
101489
相关基金
河北省自然科学基金
英文译名:
官方网址:
项目类型:
学科类型:
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导