基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对目前国内外学者对微博情感只作二分类研究,仅仅从正面和负面研究微博情感不足的问题,选取NLPCC2013-2014年多情感的微博数据集,重点研究常用的3种机器学习算法、3种特征选择以及特征权重方法对中文微博情感多分类的影响.实验表明:不管选择哪种特征权重,使用SVM的微博文本分类准确率都最高,KNN的准确率最低;不同特征权重下,信息增益作为特征选择的方法时,3个算法各自准确率都是最高的;当信息增益为特征选择,T F-ID F为特征权重时,支持向量机的文本分类准确率最高.由于微博简短、口语化,词袋模型忽视了词与词间的联系,导致微博情感分类准确率不高.
推荐文章
基于回应消息的中文微博情感分类方法
中文微博
情感分类
回应消息
支持向量机
基于机器学习的中文微博情感分类实证研究
微博
情感分类
机器学习
特征选取
特征项权重
机器学习与语义规则融合的微博情感分类方法
微博情感分析
机器学习
规则方法
特征嵌入
系统融合
基于监督学习的微博情感分类方法
微博
情感分类
监督学习
情感词汇本体
同义词词林
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于机器学习的微博情感分类研究
来源期刊 软件导刊 学科 工学
关键词 机器学习 情感分类 微博 特征选择 特征权重
年,卷(期) 2018,(6) 所属期刊栏目 软件理论与方法
研究方向 页码范围 58-61,66
页数 5页 分类号 TP301
字数 4498字 语种 中文
DOI 10.11907/rjdk.173073
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 田大钢 上海理工大学管理学院 54 437 12.0 19.0
2 冯成刚 上海理工大学管理学院 2 13 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (47)
共引文献  (492)
参考文献  (7)
节点文献
引证文献  (9)
同被引文献  (35)
二级引证文献  (11)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(7)
  • 参考文献(1)
  • 二级参考文献(6)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(4)
  • 参考文献(0)
  • 二级参考文献(4)
2012(11)
  • 参考文献(3)
  • 二级参考文献(8)
2013(3)
  • 参考文献(0)
  • 二级参考文献(3)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(11)
  • 引证文献(7)
  • 二级引证文献(4)
2020(8)
  • 引证文献(1)
  • 二级引证文献(7)
研究主题发展历程
节点文献
机器学习
情感分类
微博
特征选择
特征权重
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件导刊
月刊
1672-7800
42-1671/TP
16开
湖北省武汉市
38-431
2002
chi
出版文献量(篇)
9809
总下载数(次)
57
总被引数(次)
30383
论文1v1指导