基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了基于相似记录项归纳的动态网页信息抽取方法.该方法采用编辑距离算法和树排列算法归纳产生记录项的包装器树.对各种类型网页进行信息抽取实验,取得98.11%的召回率和96.90%的准确率.
推荐文章
基于JSP的动态网页开发技术
JSP技术
动态网页
WEB技术
网页开发
WAP动态网页的研究
WAP
ASP
动态网页
基于片段缓存的动态网页传送模型
动态网页
片段缓存
共享片段
Web缓存
基于模板库的动态网页的设计研究及实现
模板库
动态网页
JSP
Struts
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于SRI的动态网页信息抽取方法
来源期刊 重庆工学院学报(自然科学版) 学科 工学
关键词 动态网页 信息抽取 包装器 DOM树
年,卷(期) 2009,(10) 所属期刊栏目 信息 电子 计算机
研究方向 页码范围 87-93
页数 7页 分类号 TP311
字数 5499字 语种 中文
DOI 10.3969/j.issn.1674-8425-B.2009.10.021
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 高志强 东南大学计算机科学与工程学院 25 266 6.0 16.0
2 朱跃林 6 6 2.0 2.0
3 戴昌林 东南大学计算机科学与工程学院 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (3)
同被引文献  (2)
二级引证文献  (4)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(2)
  • 引证文献(2)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(1)
  • 引证文献(0)
  • 二级引证文献(1)
2014(2)
  • 引证文献(0)
  • 二级引证文献(2)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
动态网页
信息抽取
包装器
DOM树
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
重庆理工大学学报(自然科学版)
月刊
1674-8425
50-1205/T
重庆市九龙坡区杨家坪
chi
出版文献量(篇)
7998
总下载数(次)
17
总被引数(次)
41083
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导