基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着Web编程技术的发展,同类主题网页可以采用不同的Html标签展示出视觉特征相同的网页信息,导致需要匹配Html标签名称的现有网页结构相似性算法无法准确识别同类主题网页.因此,提出一种主题网页标签树邻接矩阵识别算法,通过构造主题网页标签树邻接矩阵,并利用邻接矩阵的结构特征来计算网页之间的结构相似度以实现同类主题网页识别.实验结果表明,该算法的最佳性能达到查全率100%、查准率96%,平均性能达到查全率97%、查准率89%.
推荐文章
基于杆组邻接矩阵的平面构型的同构识别
邻接矩阵
同构识别
Assur杆组
运动链
有限交换环零因子图的邻接矩阵
零因子图
邻接矩阵
交换环
特征多项式
树的邻接矩阵
邻接矩阵
A-序
B-序
基于邻接矩阵的行星轮系传动比计算方法
行星轮系
图论模型
邻接矩阵
基本回路
传动比
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 主题网页标签树邻接矩阵识别算法研究
来源期刊 计算机科学 学科 工学
关键词 网页结构 Html标签 标签树邻接矩阵
年,卷(期) 2016,(6) 所属期刊栏目 图形图像与模式识别
研究方向 页码范围 316-320
页数 5页 分类号 TP391
字数 4544字 语种 中文
DOI 10.11896/j.issn.1002-137X.2016.6.063
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 宋军 重庆交通大学信息科学与工程学院 43 256 9.0 12.0
2 李益才 重庆交通大学信息科学与工程学院 15 56 5.0 6.0
3 王家伟 重庆交通大学信息科学与工程学院 22 98 6.0 8.0
4 杨晓夫 重庆交通大学信息科学与工程学院 2 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (11)
共引文献  (26)
参考文献  (4)
节点文献
引证文献  (3)
同被引文献  (4)
二级引证文献  (1)
1979(2)
  • 参考文献(0)
  • 二级参考文献(2)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(1)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
网页结构
Html标签
标签树邻接矩阵
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导