基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文章提出一种基于DOM的Web信息提取方法,通过归纳学习获得被提取信息的定位路径,利用XPath和XSLT在数据定位和数据转换方面的特点编写提取模式,根据网页元素与DOM节点对应关系,判断所获得信息源是否适用于已有提取模式.
推荐文章
基于DOM的WEB表单信息的提取技术
电子签章
DOM
WEB表单
信息提取
基于DOM的中文人物WEB信息提取
信息提取
文档对象模型
影响因子
中文人物
基于DOM和元数据的Web信息提取
包装器
DOM
元数据
信息提取
归纳学习
基于DOM修剪的藏文Web信息提取
音节点
DOM树
藏文
Web信息提取
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于DOM的Web信息提取方法
来源期刊 微型电脑应用 学科 工学
关键词 Web信息提取 DOM XPath XSLT 基于DOM的网页结构判断
年,卷(期) 2007,(3) 所属期刊栏目 技术交流
研究方向 页码范围 49-52
页数 4页 分类号 TP393
字数 3392字 语种 中文
DOI 10.3969/j.issn.1007-757X.2007.03.017
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 熊选东 解放军信息工程大学电子技术学院研究所 15 68 5.0 7.0
2 邓超 解放军信息工程大学电子技术学院研究所 2 17 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (12)
同被引文献  (5)
二级引证文献  (45)
2007(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2008(2)
  • 引证文献(2)
  • 二级引证文献(0)
2009(2)
  • 引证文献(2)
  • 二级引证文献(0)
2010(2)
  • 引证文献(1)
  • 二级引证文献(1)
2011(7)
  • 引证文献(3)
  • 二级引证文献(4)
2012(3)
  • 引证文献(1)
  • 二级引证文献(2)
2013(3)
  • 引证文献(0)
  • 二级引证文献(3)
2014(3)
  • 引证文献(1)
  • 二级引证文献(2)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(6)
  • 引证文献(2)
  • 二级引证文献(4)
2017(10)
  • 引证文献(0)
  • 二级引证文献(10)
2018(9)
  • 引证文献(0)
  • 二级引证文献(9)
2019(5)
  • 引证文献(0)
  • 二级引证文献(5)
2020(4)
  • 引证文献(0)
  • 二级引证文献(4)
研究主题发展历程
节点文献
Web信息提取
DOM
XPath
XSLT
基于DOM的网页结构判断
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
微型电脑应用
月刊
1007-757X
31-1634/TP
16开
上海市华山路1954号上海交通大学铸锻楼314室
4-506
1984
chi
出版文献量(篇)
6963
总下载数(次)
20
总被引数(次)
28091
论文1v1指导