基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对Web结构挖掘算法容易出现“主题漂移”以及主机间的多重互相加强关系的问题,提出了一种基于最大流与页面相似度值的超链接结构挖掘方法.该方法在传统的超链接结构挖掘算法HITS的基础上引入页面相似度值构造邻接矩阵,并结合基于最大流的Web社区发现技术来构建特征向量空间模型,通过迭代计算最终获得价值最高的权威结果集和中心结果集.实验结果证明该方法有较好的查准率与查全率,并有效抑制了“主题漂移”现象,具有一定的实用价值.
推荐文章
基于链接关系的Web页面相似度搜索
Web页面网络
相似度搜索
SimRank
基于网络用户行为的相关页面挖掘模型
相关页面
web挖掘
网络用户行为
模糊聚类的最大树算法在Web页面分类中的应用
数据挖掘
Web日志
Web使用挖掘
模糊聚类
最大树法
基于web挖掘中最大频繁项目集的研究
web日志挖掘
智能推荐
最大频繁项集
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于最大流及页面相似度的Web结构挖掘
来源期刊 计算机技术与发展 学科 工学
关键词 Web结构挖掘 主题漂移 页面相似度值
年,卷(期) 2011,(10) 所属期刊栏目 智能、算法、系统工程
研究方向 页码范围 112-115
页数 分类号 TP301.6
字数 3964字 语种 中文
DOI 10.3969/j.issn.1673-629X.2011.10.029
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吴晓军 陕西师范大学计算机科学学院 32 229 8.0 14.0
2 李莹 陕西师范大学计算机科学学院 23 31 2.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (44)
共引文献  (87)
参考文献  (10)
节点文献
引证文献  (2)
同被引文献  (3)
二级引证文献  (0)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(7)
  • 参考文献(0)
  • 二级参考文献(7)
2000(4)
  • 参考文献(0)
  • 二级参考文献(4)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(7)
  • 参考文献(0)
  • 二级参考文献(7)
2004(6)
  • 参考文献(1)
  • 二级参考文献(5)
2005(8)
  • 参考文献(2)
  • 二级参考文献(6)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(4)
  • 参考文献(4)
  • 二级参考文献(0)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Web结构挖掘
主题漂移
页面相似度值
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导