原文服务方: 微电子学与计算机       
摘要:
通过对论文元数据网页的分析发现论文摘要页面的各种元数据在长度、前置引导词、分隔符等方面都具有特定的规律,并据此提出了基于元数据特征的元数据抽取算法,归纳出了论文元数据的7个形式特征和2个语义特征,定义了确定特征和排除特征,描述了特征相似度算法的6个步骤,给出了分别采用正则表达式方法和特征相似度方法的试验结果,测试表明,采用特征相似度方法的提取成功率从68%提高到了95%,达到了实用水平.
推荐文章
基于元相似度的推荐算法
协同过滤
推荐系统
元相似度
基于相似度的三元社团合并算法
复杂网络
社团发现
相似度
从属度
三元社团
基于特征选择检验的交会数据相似度验证方法
无线电引信
半实物仿真
交会数据
相似度
特征选择检验
基于数据相似度的自适应半监督随机森林算法
随机森林
半监督学习算法
数据相似度
路径集合稀疏编码
自适应
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于特征相似度的科技论文元数据提取算法研究
来源期刊 微电子学与计算机 学科
关键词 元数据抽取 特征相似度 形式特征 语义特征 确定特征 排除特征 最大相似度原则
年,卷(期) 2008,(8) 所属期刊栏目
研究方向 页码范围 129-132
页数 4页 分类号 TP31
字数 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 蒋路 2 13 1.0 2.0
2 钱建立 西北工业大学机电学院 6 33 4.0 5.0
3 吴广茂 西北工业大学机电学院 4 24 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (13)
共引文献  (122)
参考文献  (5)
节点文献
引证文献  (12)
同被引文献  (23)
二级引证文献  (22)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(5)
  • 参考文献(2)
  • 二级参考文献(3)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(2)
  • 参考文献(2)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
  • 引证文献(0)
  • 二级引证文献(0)
2010(3)
  • 引证文献(3)
  • 二级引证文献(0)
2011(3)
  • 引证文献(2)
  • 二级引证文献(1)
2012(1)
  • 引证文献(0)
  • 二级引证文献(1)
2013(3)
  • 引证文献(1)
  • 二级引证文献(2)
2014(1)
  • 引证文献(0)
  • 二级引证文献(1)
2015(2)
  • 引证文献(1)
  • 二级引证文献(1)
2016(3)
  • 引证文献(1)
  • 二级引证文献(2)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(4)
  • 引证文献(1)
  • 二级引证文献(3)
2019(9)
  • 引证文献(2)
  • 二级引证文献(7)
2020(4)
  • 引证文献(0)
  • 二级引证文献(4)
研究主题发展历程
节点文献
元数据抽取
特征相似度
形式特征
语义特征
确定特征
排除特征
最大相似度原则
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
微电子学与计算机
月刊
1000-7180
61-1123/TN
大16开
1972-01-01
chi
出版文献量(篇)
9826
总下载数(次)
0
总被引数(次)
59060
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导