作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
大数据时代下,档案文本数据规模海量递增,增加了聚类分析的难度,如何准确、高效的实现档案数据全自动分类.而针对以往PSI算法在高纬度、稀疏特征中易于陷入局部最优,本文引入GWO算法,通过对种群精英个体的克隆和变异,及基于DE算法的个体更新算法创新,来规避早期收敛和局部最优的问题,而后,引入FastText有监督快速分类方法,基于softmax分层技术完成海量档案数据的全自动化分类,以提升档案分类的可靠性和效率.
推荐文章
基于模糊聚类的文本分类器
文本分类
模糊聚类
编网法
模糊相似度
基于LSTM自动编码机的短文本聚类方法
自然语言处理
短文本
聚类
长短期记忆网络
自动编码机
基于聚类改进的 KN N文本分类算法
文本分类
KNN
聚类化
训练集
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于文本聚类的档案数据全自动分类方法研究
来源期刊 电子测试 学科
关键词 聚类分析 GWO算法 档案数据 局部最优
年,卷(期) 2021,(14) 所属期刊栏目 理论与算法|The theory and algorithm
研究方向 页码范围 53-54
页数 2页 分类号
字数 语种 中文
DOI 10.3969/j.issn.1000-8519.2021.14.019
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (84)
共引文献  (0)
参考文献  (5)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(4)
  • 参考文献(0)
  • 二级参考文献(4)
2012(5)
  • 参考文献(0)
  • 二级参考文献(5)
2013(3)
  • 参考文献(0)
  • 二级参考文献(3)
2014(2)
  • 参考文献(0)
  • 二级参考文献(2)
2015(4)
  • 参考文献(0)
  • 二级参考文献(4)
2016(7)
  • 参考文献(0)
  • 二级参考文献(7)
2017(9)
  • 参考文献(0)
  • 二级参考文献(9)
2018(27)
  • 参考文献(0)
  • 二级参考文献(27)
2019(11)
  • 参考文献(0)
  • 二级参考文献(11)
2020(7)
  • 参考文献(4)
  • 二级参考文献(3)
2021(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
聚类分析
GWO算法
档案数据
局部最优
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子测试
半月刊
1000-8519
11-3927/TN
大16开
北京市100098-002信箱
82-870
1994
chi
出版文献量(篇)
19588
总下载数(次)
63
论文1v1指导