基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对经典TF-IDF算法在在文档特征词提取中因忽略了词之间连接关系而导致提取准确率较低的问题,提出一种基于word2vec加权的TextRank词图构建方法.首先通过爬虫获取网络产品评论语料,并进行分词、词性标注以及名词提取等预处理;其次利用word2vec形成词元与词元之间的相似度矩阵;最后将word2vec中获取到的词元之间的相似度作为词语影响力权值,对经典TextRank产品特征提取方法进行改进.实验数据表明,与传统的TextRank产品特征提取方法相比,改进后的方法查准率提高了5%,查全率提高了2.9%,在实际工程中能够有效的提高产品特征提取的准确率.
推荐文章
基于TextRank的空管特情案例特征提取技术
空管特情案例
案例利用
TextRank算法
特征提取
领域知识
基于隐马尔可夫模型的躯感网心电图信号特征提取方法
躯感网
心电图信号
隐马尔可夫模型
特征提取
基于Fisher的Gabor特征提取方法
Gabor滤波
Fisher线性判别
手写数字识别
特征提取
LIBSVM
基于DEM的流域特征提取方法研究进展
分布式水文模型
GIS
DEM
流域特征提取
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于TextRank的网评产品特征提取方法
来源期刊 青岛大学学报(自然科学版) 学科 工学
关键词 评论 特征词抽取 TF-IDF Word2vec TextRank
年,卷(期) 2018,(1) 所属期刊栏目 信息工程
研究方向 页码范围 109-114
页数 6页 分类号 TP301.6
字数 4134字 语种 中文
DOI 10.3969/j.issn.1006-1037.2018.02.20
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郭振波 青岛大学青岛大学计算机科学技术学院 16 85 4.0 9.0
2 王开西 青岛大学青岛大学计算机科学技术学院 9 12 2.0 3.0
3 何金金 青岛大学数据科学与软件工程学院 3 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (17)
共引文献  (82)
参考文献  (5)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(3)
  • 参考文献(0)
  • 二级参考文献(3)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(3)
  • 参考文献(2)
  • 二级参考文献(1)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
评论
特征词抽取
TF-IDF
Word2vec
TextRank
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
青岛大学学报(自然科学版)
季刊
1006-1037
37-1245/N
16开
青岛市宁夏路308号
1988
chi
出版文献量(篇)
1805
总下载数(次)
12
总被引数(次)
6176
论文1v1指导