基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
关键词提取在自然语言处理领域有着广泛的应用,如何准确、快速地从文本中获取关键词信息已经成为文本处理的关键性问题.现有的关键词提取方法很多,但是这些关键词提取方法的准确率和通用性有待提高.因此,提出了一种改进的TextRank关键词提取方法,该方法使用TF-IDF方法与平均信息熵方法计算文本中词语的重要性,然后根据计算结果得到词语的综合权重.利用词语的综合权重改进TextRank算法的节点初始值以及节点概率转移矩阵,通过迭代的方式计算各个节点的权重,直至收敛,从而得到词语的权重信息,选择top N个词语作为关键词输出,实现关键词的提取功能.实验结果表明,相较于传统的TF-IDF方法和TextRank方法,提出的改进后的TextRank关键词提取方法有更好的通用性,提取的关键词的准确率更高.
推荐文章
基于词向量与TextRank的关键词提取方法
抽取
语义差异性
TextRank
词向量
隐含主题分布
基于组合词和同义词集的关键词提取算法
组合词
同义词集
中文网页
关键词提取
一种基于TextRank的单文本关键字提取算法
TextRank
单文本关键字
提取算法
有向带权图
马尔可夫状态转移模型
基于万有引力改进的TextRank关键词提取算法
主题影响度
词向量
TextRank
万有引力
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种改进的TextRank关键词提取算法
来源期刊 计算机技术与发展 学科 工学
关键词 提取 TF-IDF算法 TextRank算法 平均信息熵 自然语言处理
年,卷(期) 2020,(3) 所属期刊栏目 智能、算法、系统工程
研究方向 页码范围 77-81
页数 5页 分类号 TP301
字数 3832字 语种 中文
DOI 10.3969/j.issn.1673-629X.2020.03.015
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李志强 扬州大学信息工程学院 44 382 12.0 18.0
2 潘苏含 扬州大学信息工程学院 3 0 0.0 0.0
3 戴娟 扬州大学信息工程学院 7 4 2.0 2.0
4 胡佳佳 扬州大学信息工程学院 3 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (95)
共引文献  (266)
参考文献  (16)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1957(1)
  • 参考文献(0)
  • 二级参考文献(1)
1958(1)
  • 参考文献(0)
  • 二级参考文献(1)
1972(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(2)
  • 参考文献(0)
  • 二级参考文献(2)
1991(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(9)
  • 参考文献(1)
  • 二级参考文献(8)
2004(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(8)
  • 参考文献(0)
  • 二级参考文献(8)
2007(11)
  • 参考文献(1)
  • 二级参考文献(10)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(7)
  • 参考文献(1)
  • 二级参考文献(6)
2012(10)
  • 参考文献(1)
  • 二级参考文献(9)
2013(5)
  • 参考文献(1)
  • 二级参考文献(4)
2014(10)
  • 参考文献(2)
  • 二级参考文献(8)
2015(6)
  • 参考文献(0)
  • 二级参考文献(6)
2016(6)
  • 参考文献(1)
  • 二级参考文献(5)
2017(8)
  • 参考文献(2)
  • 二级参考文献(6)
2018(3)
  • 参考文献(3)
  • 二级参考文献(0)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
提取
TF-IDF算法
TextRank算法
平均信息熵
自然语言处理
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导