基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文基于二次情感特征提取算法,利用句法依存关系进行一次文本情感特征提取,在此基础上,利用情感词典,进行二次情感特征提取.构建朴素贝叶斯分类器,对采集的热门话题微博和酒店评论进行文本情感倾向性分类.主要比较了表情符号、标点符号,基于情感词典的特征提取和基于二次情感特征提取方法,在不同的组合下的分类性能,寻找更佳的微博文本情感分类预处理方法.并与酒店评论情感分类结果对比、分析,发现影响微博情感分类性能的原因.实验结果表明,二次特征提取方法在分类上取得更高的F1.实验最佳的分类预处理方式是“表情符号十标点符号十二次情感特征提取+BOOL值”.同时发现,朴素贝叶斯在酒店评论情感分类取得更高的分类性能,主要是微博评价对象多样化造成的.
推荐文章
一种基于情感词典和朴素贝叶斯的中文文本情感分类方法
文本情感分类
朴素贝叶斯
情感词典
一种新型加权朴素贝叶斯分类算法
数据挖掘
朴素贝叶斯
属性频率
基于属性约简的PLS加权朴素贝叶斯分类
加权朴素贝叶斯分类
属性约简
偏最小二乘回归
基于引力模型的朴素贝叶斯分类算法
分类算法
朴素贝叶斯
引力模型
遥感图像
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于朴素贝叶斯的微博情感分类
来源期刊 计算机工程与科学 学科 工学
关键词 微博 文本情感分类 二次情感特征提取 朴素贝叶斯
年,卷(期) 2012,(9) 所属期刊栏目 数据挖掘
研究方向 页码范围 160-165
页数 分类号 TP393
字数 5978字 语种 中文
DOI 10.3969/j.issn.1007-130X.2012.09.029
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 阳爱民 广东外语外贸大学思科信息学院 35 618 11.0 24.0
2 周咏梅 广东外语外贸大学思科信息学院 25 466 10.0 21.0
3 林江豪 广东外语外贸大学国际工商管理学院 19 266 8.0 16.0
4 陈锦 广东外语外贸大学英语语言文化学院 12 199 4.0 12.0
5 蔡泽键 广东外语外贸大学思科信息学院 1 87 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (11)
共引文献  (271)
参考文献  (4)
节点文献
引证文献  (87)
同被引文献  (133)
二级引证文献  (302)
1960(1)
  • 参考文献(0)
  • 二级参考文献(1)
1974(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(3)
  • 参考文献(1)
  • 二级参考文献(2)
2010(2)
  • 参考文献(1)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(4)
  • 引证文献(4)
  • 二级引证文献(0)
2014(23)
  • 引证文献(13)
  • 二级引证文献(10)
2015(32)
  • 引证文献(8)
  • 二级引证文献(24)
2016(35)
  • 引证文献(9)
  • 二级引证文献(26)
2017(64)
  • 引证文献(15)
  • 二级引证文献(49)
2018(94)
  • 引证文献(17)
  • 二级引证文献(77)
2019(104)
  • 引证文献(19)
  • 二级引证文献(85)
2020(33)
  • 引证文献(2)
  • 二级引证文献(31)
研究主题发展历程
节点文献
微博
文本情感分类
二次情感特征提取
朴素贝叶斯
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
总被引数(次)
59030
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导