基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对情感分类中采用单一特征分类精度不高的问题,提出多特征加权的分类算法:根据扩展的情感词典计算每个词的情感倾向度,经CHI特征选择后,根据情感词的极性强度调整贝叶斯分类模型中该词的正负后验概率,在原值的基础上加上极性强度影响值。实验将该方法和其他3种单特征选择方法在酒店、影视等语料上的分类精度进行了对比,分类精度得到提升。实验结果表明,将词语的情感倾向度的特征融入到分类器中方法,在有效提高情感倾向性分类精度的同时降低了特征维数。
推荐文章
一种基于混合特征的中文情感词典扩展方法
情感分析
情感词典
语言特征
统计特征
混合特征
面向旅游在线评论情感词典构建方法
旅游在线评论
情感词典
词向量
山岳型景区
基于词频-极性强度的抑郁症情感词挖掘方法
情感分析
双向最大匹配
词频-极性强度
语义相似度
抑郁症情感词典
结合情感词典的主动贝叶斯文本情感分类方法
主动学习
文本情感分类
情感词典
朴素贝叶斯
不确定采样策略
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于扩展情感词典及特征加权的情感挖掘方法
来源期刊 山东大学学报(工学版) 学科 工学
关键词 情感挖掘 分类 倾向性分析 特征选择 情感词典
年,卷(期) 2014,(6) 所属期刊栏目 机器学习与数据挖掘
研究方向 页码范围 15-18,69
页数 5页 分类号 TP391
字数 4083字 语种 中文
DOI 10.6040/j.issn.1672-3961.1.2014.108
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐晓丹 浙江师范大学数理与信息工程学院 21 185 8.0 13.0
2 陈中育 浙江师范大学数理与信息工程学院 44 211 7.0 13.0
3 段正杰 浙江师范大学数理与信息工程学院 7 43 4.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (19)
共引文献  (684)
参考文献  (4)
节点文献
引证文献  (13)
同被引文献  (28)
二级引证文献  (29)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(7)
  • 参考文献(1)
  • 二级参考文献(6)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(5)
  • 参考文献(1)
  • 二级参考文献(4)
2010(3)
  • 参考文献(2)
  • 二级参考文献(1)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(3)
  • 引证文献(3)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(8)
  • 引证文献(3)
  • 二级引证文献(5)
2018(10)
  • 引证文献(3)
  • 二级引证文献(7)
2019(13)
  • 引证文献(3)
  • 二级引证文献(10)
2020(7)
  • 引证文献(0)
  • 二级引证文献(7)
研究主题发展历程
节点文献
情感挖掘
分类
倾向性分析
特征选择
情感词典
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
山东大学学报(工学版)
双月刊
1672-3961
37-1391/T
大16开
济南市经十路17923号
24-221
1956
chi
出版文献量(篇)
3095
总下载数(次)
14
总被引数(次)
24236
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导