基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
大间隔近邻算法(Large Margin Nearest Neighbor,LMNN)具有较强学习能力和泛化能力,在分类领域有广泛的应用.但将其用于大规模文本分类问题时,LMNN算法中的半定规划问题规模会随着数据规模增大而急剧膨胀,导致求解困难.针对此问题,引入胡贝尔损失函数把LMNN算法的半定优化模型分解为2个低阶的连续优化子模型,降低算法的计算复杂度,提高计算效率.在舆情分类数据集上的实验结果表明,本文算法与传统大间隔近邻算法相比,精度提高了4.5%,分类时间节省了47.1%,故采用分解降阶法来改进LMNN算法的性能是可行的,更适用于大规模文本分类.
推荐文章
一种改进的基于神经网络的文本分类算法
文本分类
神经网络
K最近邻
特征选择
一种可靠信任推荐文本分类特征权重算法
文本分类
特征权重
可信计算
概率确定性密度
自然语言处理
一种改进的KNN Web文本分类方法
Web文本分类
K最近邻
快速分类
一种改进的朴素贝叶斯文本分类算法
贝叶斯
文本分类
特征词
多变量贝努力模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种大规模文本分类大间隔近邻算法
来源期刊 计算机与现代化 学科 工学
关键词 半定规划 大间隔近邻 胡贝尔损失函数 大规模文本分类 泛化能力
年,卷(期) 2016,(6) 所属期刊栏目 算法设计与分析
研究方向 页码范围 68-72
页数 5页 分类号 TP311.13
字数 3896字 语种 中文
DOI 10.3969/j.issn.1006-2475.2016.06.015
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 覃华 广西大学计算机与电子信息学院 52 334 11.0 15.0
2 陈晨 广西大学计算机与电子信息学院 11 14 2.0 3.0
3 冯志新 5 25 3.0 5.0
4 朱茜 广西大学计算机与电子信息学院 2 5 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (64)
共引文献  (49)
参考文献  (15)
节点文献
引证文献  (3)
同被引文献  (0)
二级引证文献  (0)
1928(1)
  • 参考文献(0)
  • 二级参考文献(1)
1967(1)
  • 参考文献(0)
  • 二级参考文献(1)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(2)
  • 参考文献(0)
  • 二级参考文献(2)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(4)
  • 参考文献(0)
  • 二级参考文献(4)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(3)
  • 参考文献(1)
  • 二级参考文献(2)
2009(5)
  • 参考文献(0)
  • 二级参考文献(5)
2010(6)
  • 参考文献(2)
  • 二级参考文献(4)
2011(5)
  • 参考文献(0)
  • 二级参考文献(5)
2012(6)
  • 参考文献(1)
  • 二级参考文献(5)
2013(5)
  • 参考文献(4)
  • 二级参考文献(1)
2014(3)
  • 参考文献(3)
  • 二级参考文献(0)
2015(4)
  • 参考文献(4)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
半定规划
大间隔近邻
胡贝尔损失函数
大规模文本分类
泛化能力
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与现代化
月刊
1006-2475
36-1137/TP
大16开
南昌市井冈山大道1416号
44-121
1985
chi
出版文献量(篇)
9036
总下载数(次)
25
论文1v1指导