原文服务方: 西安交通大学学报       
摘要:
针对非平衡交互文本少数类实例匮乏易导致训练的情感分类模型泛化性能差的问题,提出基于超平面距离的非平衡交互文本情感实例迁移方法.该方法将在少数类和多数类支持向量之间的源数据集实例作为待迁实例,并基于目标数据集上的分类超平面构造一个偏移超平面.依据最优信息效用原则基于待迁实例到偏移超平面的距离最短来筛选迁入的实例,同时通过调节迁入比例控制迁入实例规模生成合成数据集.实验结果表明:随着迁入实例增多,合成数据集对原始分布的偏离增大,所训练的序列最小优化算法(SMO)模型的泛化分类性能呈现先提升后降低的现象,类似于信息效用的Wundt曲线;与SMOTE、Subsampling、Oversampling 3种数据层处理方法相比,所提方法训练的SMO、LibSVM、随机森林、代价敏感、CNN 5个分类模型在少数类识别F值上平均获得11%的增幅,且迁入比例最佳范围为20%~30%,在有效缓解非平衡特性的同时提高了少数类识别的泛化分类性能.
推荐文章
领域实例迁移的交互文本非平衡情感分类方法
交互文本
非平衡情感分类
多领域
实例迁移
基于类内超平面距离度量模糊支持向量机的语音情感识别
语音情感识别
模糊支持向量机
隶属度函数
孤立点
类内超平面
精确识别
面向文本的情感迁移分析策略
情感迁移
情感分类
文本情感分析
文本情感文摘自动提取方法研究
情感文摘
浅层狄利赫雷分配
主题模型
主题特征
条件随机场模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 超平面距离的非平衡交互文本情感实例迁移方法
来源期刊 西安交通大学学报 学科
关键词 实例迁移 信息效用 非平衡分类 超平面
年,卷(期) 2018,(10) 所属期刊栏目
研究方向 页码范围 1-7
页数 7页 分类号 TP391.1
字数 语种 中文
DOI 10.7652/xjtuxb201810001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郑庆华 西安交通大学陕西省天地网技术重点实验室 118 1659 22.0 36.0
5 田锋 西安交通大学陕西省天地网技术重点实验室 29 272 9.0 16.0
9 王媛媛 西安交通大学陕西省天地网技术重点实验室 4 13 2.0 3.0
13 吴凡 西安交通大学陕西省天地网技术重点实验室 6 4 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (81)
共引文献  (70)
参考文献  (23)
节点文献
引证文献  (1)
同被引文献  (16)
二级引证文献  (0)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(1)
  • 二级参考文献(0)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(3)
  • 参考文献(1)
  • 二级参考文献(2)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(9)
  • 参考文献(0)
  • 二级参考文献(9)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(6)
  • 参考文献(0)
  • 二级参考文献(6)
2008(7)
  • 参考文献(0)
  • 二级参考文献(7)
2009(9)
  • 参考文献(1)
  • 二级参考文献(8)
2010(10)
  • 参考文献(1)
  • 二级参考文献(9)
2011(8)
  • 参考文献(2)
  • 二级参考文献(6)
2012(6)
  • 参考文献(4)
  • 二级参考文献(2)
2013(8)
  • 参考文献(2)
  • 二级参考文献(6)
2014(9)
  • 参考文献(1)
  • 二级参考文献(8)
2015(5)
  • 参考文献(3)
  • 二级参考文献(2)
2016(6)
  • 参考文献(5)
  • 二级参考文献(1)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
实例迁移
信息效用
非平衡分类
超平面
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
西安交通大学学报
月刊
0253-987X
61-1069/T
大16开
1960-01-01
chi
出版文献量(篇)
7020
总下载数(次)
0
总被引数(次)
81310
论文1v1指导