基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
网站权威性一般是由外部链接来衡量,高质量的外部链接越多,网站的权威性就越高;常用的评价网站权威性的算法有PageRank等,然而该类算法对网站权威性的影响是有选择性的,使得这种方法具有一定的弊端.本文利用深度学习的方法,通过将搜索词和网址映射为向量,计算两个向量之间的相似度来评判在某个搜索词下不同网址的权威性,把计算结果相似度高对应的网站称为在该搜索词下权威性高的网站,从而从另一种角度去衡量网站的权威性.通过对比使用Word2vec和LSTM两种不同的模型实验,在对公开的数据集上的实验结果表明使用这两种模型是有效的,其中LSTM模型比Word2vec模型的效果要好.
推荐文章
面向领域微博权威性人物分析技术与研究
社交网络
领域词典
领域微博
权威性用户
被关注度
领域微博权威性用户度量模型
论保证企业内部审计的权威性
内部审计
权威性
监督
决策
管理
基于机器学习技术的网站用户行为预测
行为预测
logistic回归
用户行为
数据集分类
机器学习
留存分析
提高产品质量检验机构的权威性
质量
检测机构
权威性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于深度学习的网站权威性预测
来源期刊 计算机系统应用 学科
关键词 网站权威性 Word2vec LSTM 自然语言处理
年,卷(期) 2018,(8) 所属期刊栏目 软件技术·算法
研究方向 页码范围 164-169
页数 6页 分类号
字数 4259字 语种 中文
DOI 10.15888/j.cnki.csa.006474
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘芳 中国科学院计算机网络信息中心 121 906 16.0 24.0
2 王珏 中国科学院计算机网络信息中心 140 3295 27.0 54.0
3 张博尧 中国科学院计算机网络信息中心 5 12 2.0 3.0
4 冯仰德 中国科学院计算机网络信息中心 15 42 3.0 6.0
5 聂宁明 中国科学院计算机网络信息中心 6 11 2.0 3.0
6 杨海华 中国科学院计算机网络信息中心 5 16 2.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (31)
共引文献  (628)
参考文献  (6)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(3)
  • 参考文献(1)
  • 二级参考文献(2)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(4)
  • 参考文献(1)
  • 二级参考文献(3)
2013(2)
  • 参考文献(1)
  • 二级参考文献(1)
2014(4)
  • 参考文献(0)
  • 二级参考文献(4)
2015(3)
  • 参考文献(0)
  • 二级参考文献(3)
2017(3)
  • 参考文献(2)
  • 二级参考文献(1)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
网站权威性
Word2vec
LSTM
自然语言处理
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
论文1v1指导