原文服务方: 西安交通大学学报       
摘要:
针对交互文本句子短、成分缺失、多领域下类分布不均衡导致的高维、特征值稀疏、正样本稀少的难点,提出面向目标数据集实例迁移的数据层面采样方法.该方法提出目标数据集和源数据集共性特征的Top-N信息增益和值占比函数,选择评价两个数据集实例相似度的特征;提出目标数据集和源数据集特征空间一致性处理方法,克服两者特征空间不一致的问题;提出分领域的实例选取与迁移方法,克服多领域下的类分布不均衡问题.实验结果表明:该方法有效缓解了交互文本的非平衡问题,使支持向量机、随机森林、朴素贝叶斯、随机委员会4个经典分类算法的加权平均的接收者运行特征曲线(receiver operating characteristic,ROC)指标提升了11.3%.
推荐文章
超平面距离的非平衡交互文本情感实例迁移方法
实例迁移
信息效用
非平衡分类
超平面
对抗长短时记忆网络的跨语言 文本情感分类方法
文本情感
跨语言
对抗
长短时记忆网络
共享特征
一种改进EM算法的跨领域情感分类方法
跨领域情感分类
EM算法
特征迁移
基于读者视角的文本情感分类
情感分类
情感标签
期望最大化算法
朴素贝叶斯
后验概率
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 领域实例迁移的交互文本非平衡情感分类方法
来源期刊 西安交通大学学报 学科
关键词 交互文本 非平衡情感分类 多领域 实例迁移
年,卷(期) 2015,(4) 所属期刊栏目
研究方向 页码范围 67-72
页数 6页 分类号 TP391.1
字数 语种 中文
DOI 10.7652/xjtuxb201504011
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (6)
节点文献
引证文献  (3)
同被引文献  (37)
二级引证文献  (2)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
交互文本
非平衡情感分类
多领域
实例迁移
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
西安交通大学学报
月刊
0253-987X
61-1069/T
大16开
1960-01-01
chi
出版文献量(篇)
7020
总下载数(次)
0
总被引数(次)
81310
论文1v1指导