作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
关键词的权值计算绝大多数都是将关键词当作独立的部分,忽略关键词间关联性.试图从关键词间关联性出发,提出关键词的权值受到其他关键词的相互贡献作用,以PageRank算法中对于网页权值的迭代计算为理论基础,提出一种基于关键词间相互投票的权值迭代计算模型,将关键词抽象为模型中各个节点,关键词的初始权值采用经典的TF-IDF方法.将改进的关键词权值计算方法应用于Reuters21578 Top10和20Newsgroup数据集上,实验结果表明,新的算法能够较为明显地差异化关键词之间权值,达到区分文本中关键词重要程度的作用.
推荐文章
基于同义替换和相邻词合并的关键词特征权重计算新方法
同义替换
相邻词
TFIDF
KSRAM
特征权重
基于PageRank的新闻关键词提取算法
成为用户搜索信息必不可少的工具.关键词以凝练简洁的形式对文本主题进行有效概括
通过提取关键词
可以结构化地表示目标文本
提高人们的文献管理与检索效率.
基于TF统计和语法分析的关键词提取算法
提取
权重计算
语法分析
中文分词
单文本关键词融合提取算法研究
TF-IDF
TextRank
TF-TR
新闻文本
自然语言处理
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于PageRank算法的文本关键词权重计算研究
来源期刊 网络新媒体技术 学科
关键词 词项权重 投票模型 迭代收敛 权值差异化 特征项区分
年,卷(期) 2015,(3) 所属期刊栏目 网络通讯与计算技术
研究方向 页码范围 37-41
页数 5页 分类号
字数 3529字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王庆福 72 209 7.0 11.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (111)
共引文献  (57)
参考文献  (15)
节点文献
引证文献  (5)
同被引文献  (0)
二级引证文献  (0)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(2)
  • 参考文献(0)
  • 二级参考文献(2)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(2)
  • 参考文献(0)
  • 二级参考文献(2)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(8)
  • 参考文献(0)
  • 二级参考文献(8)
2006(10)
  • 参考文献(0)
  • 二级参考文献(10)
2007(9)
  • 参考文献(0)
  • 二级参考文献(9)
2008(15)
  • 参考文献(1)
  • 二级参考文献(14)
2009(12)
  • 参考文献(0)
  • 二级参考文献(12)
2010(10)
  • 参考文献(0)
  • 二级参考文献(10)
2011(16)
  • 参考文献(2)
  • 二级参考文献(14)
2012(15)
  • 参考文献(2)
  • 二级参考文献(13)
2013(6)
  • 参考文献(4)
  • 二级参考文献(2)
2014(6)
  • 参考文献(6)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
词项权重
投票模型
迭代收敛
权值差异化
特征项区分
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
网络新媒体技术
双月刊
2095-347X
10-1055/TP
大16开
北京海淀区北四环西路21号
2-304
1980
chi
出版文献量(篇)
3082
总下载数(次)
5
总被引数(次)
15965
论文1v1指导