作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
以w3c文档对象模型(DOM)为基础,利用元搜索引擎原理实现了一个互联网新闻自动抽取系统.该系统通过搜索引擎获取相关新闻的web页面,分析后得到其元数据,然后利用元数据表现出来的信息进行新闻正文抽取,该方法不依赖于原网页结构,不需要人工干预,是自动、可靠、通用的方法.试验表明,该抽取方法有着较高的准确率,平均可达到96%以上.
推荐文章
元搜索引擎研究
搜索引擎
信息检索
元搜索引擎
一种基于概念抽取的元搜索引擎
元搜索引擎
概念抽取
相关度排序
元搜索引擎排序技术综述
元搜索引擎
结果集成
排序算法
相关性
基于信息类别的元搜索引擎设计
元搜索引擎
信息类别
搜索引擎
信息检索
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于元搜索引擎技术的新闻对象抽取方法研究
来源期刊 北京工商大学学报(自然科学版) 学科 工学
关键词 信息抽取 DOM 元数据 分装器
年,卷(期) 2008,(3) 所属期刊栏目 计算机科学与工程
研究方向 页码范围 66-69
页数 4页 分类号 TP312
字数 3495字 语种 中文
DOI 10.3969/j.issn.1671-1513.2008.03.017
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 何渝 北京工商大学计算机学院 19 66 6.0 7.0
2 刘敏 北京工商大学计算机学院 4 22 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (4)
参考文献  (1)
节点文献
引证文献  (3)
同被引文献  (4)
二级引证文献  (3)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2009(3)
  • 引证文献(2)
  • 二级引证文献(1)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2011(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
信息抽取
DOM
元数据
分装器
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
食品科学技术学报
双月刊
2095-6002
10-1151/TS
大16开
北京海淀区阜成路33号 北京工商大学《食品科学技术学报》编辑部
1983
chi
出版文献量(篇)
2093
总下载数(次)
8
总被引数(次)
16411
论文1v1指导