作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
网页的链接关系反映了网页之间联系的紧密程度,这种紧密关系是网页聚类的重要依据.首先通过对网页链路结构的特点分析,提出网页节点的基本集、扩展集、半径、邻域、密度和路径树等概念;然后,利用共享入度出度以及网页之间的相异度来衡量其距离,并结合扩展集中的链接信息设计了两页相似度的计算模型;最后,利用密度分布对网页进行聚类.实验结果表明,本算法具有较好的聚类效果.
推荐文章
一种与聚类系数相结合的链路预测方法
复杂网络
聚类系数
共同邻居
链路预测
结构相似性
ROC曲线
AUC值
基于Hyperlink聚类的网页分类研究
网页分类
超链接
聚类
中心点
基于结构相似网页聚类的正文提取算法研究
正文提取
相似性
文档对象模型(DOM)树
层次聚类
一种与聚类系数相结合的链路预测方法
复杂网络
聚类系数
共同邻居
链路预测
结构相似性
ROC曲线
AUC值
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 链路结构的网页聚类研究
来源期刊 小型微型计算机系统 学科 工学
关键词 Web挖掘 链接分析 网页聚类
年,卷(期) 2016,(7) 所属期刊栏目 计算机软件与数据库研究
研究方向 页码范围 1450-1454
页数 5页 分类号 TP311
字数 4777字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘勘 中南财经政法大学信息与安全工程学院 24 252 7.0 15.0
2 范琴 中南财经政法大学信息与安全工程学院 2 5 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (18)
共引文献  (8)
参考文献  (12)
节点文献
引证文献  (2)
同被引文献  (3)
二级引证文献  (0)
1976(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(5)
  • 参考文献(0)
  • 二级参考文献(5)
2008(5)
  • 参考文献(1)
  • 二级参考文献(4)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(5)
  • 参考文献(2)
  • 二级参考文献(3)
2011(3)
  • 参考文献(3)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Web挖掘
链接分析
网页聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
小型微型计算机系统
月刊
1000-1220
21-1106/TP
大16开
辽宁省沈阳市东陵区南屏东路16号
8-108
1980
chi
出版文献量(篇)
11026
总下载数(次)
17
总被引数(次)
83133
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导