基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
分析和监测微博文本中所包含的情感信息,能够挖掘用户行为,为微博舆情监管提供借鉴.但微博文本具有长度较短、不规范、存在大量变形词和新词等特点,仅以情感词为特征对微博进行分类的方法准确率较低,难以满足实际使用.为此,基于微博语料构建二元搭配词库,并根据PMI-IR算法结合语料库统计信息,提出搭配词组情感权值的计算方法PMI-IR-P.结合情感词典,采用统计方法生成微博情感特征向量,利用机器学习中的C4.5算法构建分类模型,对微博文本进行情感倾向分类.分别使用不同的数据集用于构建搭配词库及分类模型,并与基于情感词典的分类方法以及朴素贝叶斯分类方法进行对比.实验结果表明,提出的情感特征通过运用C4.5算法对微博文本情感分类的准确率达到87%,具有较好的效果.
推荐文章
基于二元依存同义词替换隐写算法
文本
信息隐藏
同义词
二元依存词语
向量距离
基于SVM和CRF多特征组合的微博情感分析
微博
情感分析
支持向量机
条件随机场
基于关键句分析的微博情感倾向性研究
情感分析
倾向性分析
关键句
依存句法分析
观点挖掘
多特征融合的图文微博情感分析
情感分析
微博
多特征融合
神经网络
图文融合
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于二元搭配词的微博情感特征选择
来源期刊 计算机工程 学科 工学
关键词 搭配词库 微博情感特征 微博情感分类 机器学习 C4.5算法
年,卷(期) 2014,(6) 所属期刊栏目 人工智能及识别技术
研究方向 页码范围 162-165
页数 4页 分类号 TP18
字数 4071字 语种 中文
DOI 10.3969/j.issn.1000-3428.2014.06.035
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 阳爱民 广东外语外贸大学思科信息学院 35 618 11.0 24.0
2 周咏梅 广东外语外贸大学思科信息学院 25 466 10.0 21.0
3 王璇璇 广东外语外贸大学西方语言文化学院 1 9 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (52)
共引文献  (298)
参考文献  (9)
节点文献
引证文献  (9)
同被引文献  (35)
二级引证文献  (28)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(8)
  • 参考文献(0)
  • 二级参考文献(8)
2007(14)
  • 参考文献(1)
  • 二级参考文献(13)
2008(8)
  • 参考文献(1)
  • 二级参考文献(7)
2009(5)
  • 参考文献(1)
  • 二级参考文献(4)
2010(9)
  • 参考文献(3)
  • 二级参考文献(6)
2011(4)
  • 参考文献(0)
  • 二级参考文献(4)
2012(4)
  • 参考文献(3)
  • 二级参考文献(1)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(3)
  • 引证文献(3)
  • 二级引证文献(0)
2016(2)
  • 引证文献(1)
  • 二级引证文献(1)
2017(5)
  • 引证文献(3)
  • 二级引证文献(2)
2018(15)
  • 引证文献(2)
  • 二级引证文献(13)
2019(8)
  • 引证文献(0)
  • 二级引证文献(8)
2020(4)
  • 引证文献(0)
  • 二级引证文献(4)
研究主题发展历程
节点文献
搭配词库
微博情感特征
微博情感分类
机器学习
C4.5算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
论文1v1指导