原文服务方: 计算机应用研究       
摘要:
单词的统计特征在自然语言处理中具有广泛应用.针对统计特征对关键词抽取和文本分类精确度的影响,分析了八种常见的统计特征,通过情感词抽取和商品评论分类,研究统计特征在情感分析领域中的作用.利用八种统计特征构造文本向量空间模型,替代基于单词构造文本向量空间模型的方法,能够降低文本向量的维度,具有隐形语义空间(LSA/SVD)的压缩效果,在保证分类结果准确率的前提下有效降低了算法的复杂度,能够替代传统的向量空间模型.情感词提取实验的结果表明,通过结合统计特征与词性,情感词提取的准确率能够达到76.4%,显著高于基于统计特征或单词词性的情感词提取算法;商品评论分类的测试结果表明,与传统的基于单词的文本情感分类相比,基于统计特征的商品评论分类的准确率提高了10.8%.
推荐文章
K-means和SOM在商品评论中的情感词聚类对比
K-means
SOM
商品评论
情感词聚类
基于情感计算的商品评论分析系统
电子商务
商品评论
关联规则
句法分析
情感计算
情感分析在商品评论中的应用
自然语言处理
在线评论
情感分析
情感词典
AABC-SVM模型及其在商品评论情感分类中的应用
人工蜂群算法
支持向量机
商品评论
情感分类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 单词统计特性在情感词自动抽取和商品评论分类中的作用
来源期刊 计算机应用研究 学科
关键词 统计特征 情感词提取 商品评论分类
年,卷(期) 2019,(3) 所属期刊栏目 系统应用开发
研究方向 页码范围 866-872
页数 7页 分类号 TP391
字数 语种 中文
DOI 10.19734/j.issn.1001-3695.2017.09.0913
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 马宏伟 山东建筑大学计算机科学与技术学院 19 504 5.0 19.0
2 韩彤晖 山东建筑大学计算机科学与技术学院 2 4 1.0 2.0
3 杨东强 山东建筑大学计算机科学与技术学院 2 4 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (6)
节点文献
引证文献  (3)
同被引文献  (11)
二级引证文献  (1)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
统计特征
情感词提取
商品评论分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导