基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对特定的网站或网页中抽取出用户感兴趣的信息这一问题,分析现有去噪技术的优缺点,提出了一种基于统计学特征和DOM树的Web页面去噪方法.该方法首先对原始网页进行预处理,然后分析网页的统计学特征,结合启发式的抽取规则,对网页进行去噪.实验证实该方法在较少人为干预的基础上能达到较好的抽取效果.
推荐文章
一种基于形态学的小波阈值去噪方法
小波变换
形态学
半-软阈值
图像去噪
一种基于稀疏表示的图像去噪算法
图像去噪
稀疏表示
小波变换
脊波变换
一种基于数学形态学的二值图像去噪算法
数学形态学
二值图像
去噪
基于DOM树结构的Blog网页自动识别
博客网页
文档对象模型结构分析
特征发现
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于统计学特征和DOM树的网页去噪技术
来源期刊 重庆理工大学学报(自然科学版) 学科 工学
关键词 DOM 统计学特征 信息检索
年,卷(期) 2011,(1) 所属期刊栏目 信息·计算机
研究方向 页码范围 54-58
页数 分类号 TP393
字数 2864字 语种 中文
DOI 10.3969/j.issn.1674-8425-B.2011.01.011
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐小乐 重庆交通大学信息科学与工程学院 5 46 3.0 5.0
2 何友全 重庆交通大学信息科学与工程学院 24 131 6.0 11.0
3 徐澄 重庆交通大学管理学院 3 45 3.0 3.0
4 唐华姣 重庆交通大学信息科学与工程学院 3 45 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (47)
参考文献  (4)
节点文献
引证文献  (15)
同被引文献  (17)
二级引证文献  (8)
1967(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(3)
  • 参考文献(1)
  • 二级参考文献(2)
2008(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(3)
  • 引证文献(3)
  • 二级引证文献(0)
2013(3)
  • 引证文献(3)
  • 二级引证文献(0)
2014(5)
  • 引证文献(4)
  • 二级引证文献(1)
2015(4)
  • 引证文献(3)
  • 二级引证文献(1)
2016(3)
  • 引证文献(1)
  • 二级引证文献(2)
2017(2)
  • 引证文献(1)
  • 二级引证文献(1)
2018(2)
  • 引证文献(0)
  • 二级引证文献(2)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
DOM
统计学特征
信息检索
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
重庆理工大学学报(自然科学版)
月刊
1674-8425
50-1205/T
重庆市九龙坡区杨家坪
chi
出版文献量(篇)
7998
总下载数(次)
17
总被引数(次)
41083
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导