基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
读者情绪分类具体是指针对某个文本推测读者可能产生的情绪.针对该新问题,目前遇到的主要挑战是标注语料库的匮乏问题.文章提出了一种基于主动学习的读者情绪分类方法,即在已有少量标注样本的基础上,利用主动学习方法挑选优质样本,使得使用尽量少的标注代价获得较好的分类性能.考虑到新闻读者情绪分类可以同时使用新闻文本和评论文本的特殊性,提出了分类器融合分类方法,并在主动学习方面提出了结合不确定性与新闻评论信息量的挑选策略.实验表明,分类器融合方法能够获得比仅用新闻文本更好的分类性能.此外,文章提出的主动学习方法能够有效减小标注规模,在同等标注规模下,获得比随机更佳的分类性能.
推荐文章
基于读者视角的文本情感分类
情感分类
情感标签
期望最大化算法
朴素贝叶斯
后验概率
基于主动学习的分类器融合算法
主动学习
分类器
融合算法
基于SVM主动学习技术的 PU 文本分类
支持向量机
主动学习
PU
文本分类
Rocchio
基于主动学习的微博数据分类
微博数据
主动学习
支持向量机
分类模型
训练集
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于主动学习的新闻读者情绪分类方法
来源期刊 山西大学学报(自然科学版) 学科 工学
关键词 读者情绪分类 主动学习 分类器融合 评论信息量
年,卷(期) 2017,(1) 所属期刊栏目 第二十二届全国信息检索学术会议(CCIR 2016)论文选登
研究方向 页码范围 21-26
页数 分类号 TP391
字数 语种 中文
DOI 10.13451/j.cnki.shanxi.univ(nat.sci.).2017.01.004
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 周国栋 苏州大学自然语言处理实验室 138 1425 22.0 32.0
2 李寿山 苏州大学自然语言处理实验室 68 618 13.0 23.0
3 刘欢欢 苏州大学自然语言处理实验室 4 27 3.0 4.0
4 陈敬 苏州大学自然语言处理实验室 3 9 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (18)
共引文献  (23)
参考文献  (10)
节点文献
引证文献  (2)
同被引文献  (5)
二级引证文献  (0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(4)
  • 参考文献(1)
  • 二级参考文献(3)
2012(6)
  • 参考文献(2)
  • 二级参考文献(4)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(2)
  • 参考文献(0)
  • 二级参考文献(2)
2015(2)
  • 参考文献(1)
  • 二级参考文献(1)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
读者情绪分类
主动学习
分类器融合
评论信息量
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
山西大学学报(自然科学版)
季刊
0253-2395
14-1105/N
大16开
太原市坞城路92号
22-42
1960
chi
出版文献量(篇)
2646
总下载数(次)
7
总被引数(次)
12039
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导