基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
WWW的迅速发展,使其日益成为人们查找有用数据的重要来源.本文介绍了一种基于Web的信息抽取的实现方法,能够按照规则模式重复地将半结构化网页中的信息自动抽取出来.
推荐文章
基于DOM的Web信息抽取
DOM
包装器
抽取规则
信息抽取
一种基于特征符号的网页主题信息抽取方法
生成树模型
特征符号
相关度
主题提取
Web信息抽取技术综述
Web信息抽取
网页噪声
URL聚类
DSE算法
RoadRunner系统
MDR
视觉特征
模板
Web 信息抽取技术在吹哨系统中的研究与应用
信息抽取
舆情
数据采集
分布函数
网页结构
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Web的网页信息抽取方法的研究
来源期刊 洛阳工业高等专科学校学报 学科 工学
关键词 信息抽取 规则 模式
年,卷(期) 2005,(3) 所属期刊栏目 理工文丛
研究方向 页码范围 30-31
页数 2页 分类号 TP391
字数 2219字 语种 中文
DOI 10.3969/j.issn.1674-5043.2005.03.014
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 苗长芬 新乡师范高等专科学校计算机科学系 6 18 2.0 4.0
2 冯伟华 中国烟草总公司郑州烟草研究院 12 98 6.0 9.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (1)
共引文献  (43)
参考文献  (2)
节点文献
引证文献  (7)
同被引文献  (12)
二级引证文献  (17)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2006(2)
  • 引证文献(2)
  • 二级引证文献(0)
2007(2)
  • 引证文献(2)
  • 二级引证文献(0)
2008(1)
  • 引证文献(1)
  • 二级引证文献(0)
2009(3)
  • 引证文献(0)
  • 二级引证文献(3)
2010(5)
  • 引证文献(1)
  • 二级引证文献(4)
2011(2)
  • 引证文献(0)
  • 二级引证文献(2)
2012(3)
  • 引证文献(0)
  • 二级引证文献(3)
2013(2)
  • 引证文献(0)
  • 二级引证文献(2)
2014(1)
  • 引证文献(0)
  • 二级引证文献(1)
2015(2)
  • 引证文献(0)
  • 二级引证文献(2)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
信息抽取
规则
模式
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
洛阳理工学院学报(自然科学版)
季刊
1674-5043
41-1403/N
大16开
河南省洛阳市洛龙区学府路1号
1986
chi
出版文献量(篇)
2249
总下载数(次)
9
总被引数(次)
5998
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导