基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
短文本因其文本较短和文本特征稀疏,导致信息量少且抗噪能力弱,因此短文本分类问题面临着巨大挑战.提出了词嵌入、词相似度和词重要性共同作用的文本表示方法,在Word2vec上引入词语相似度,并通过相似度与词频?逆文本频率(TF?IDF)的乘积来表示扩展词语对短文本的影响因子,并构造短文本向量,从而实现短文本分类.试验结果表明,该方法的分类准确率优于传统的词袋法、直接采用Word2vec训练的词向量、词向量不加权直接扩展和仅考虑TF?IDF加权扩展等方法.
推荐文章
基于扩展短文本词特征向量的分类研究
短文本
Word2vec模型
词嵌入
改进后的特征权重算法
语义相关度
基于词向量特征扩展的中文短文本分类研究
短文本
维基百科
特征扩展
词向量
文本分类
基于LDA特征扩展的短文本分类方法研究
短文本分类
隐含狄利克雷分布(LDA)
特征扩展
SVM
基于LDA特征扩展的短文本分类
隐含狄利克雷分布
文本分类
支持向量机
特征扩展
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于词嵌入的短文本扩展分类方法
来源期刊 指挥信息系统与技术 学科 工学
关键词 Word2vec 词频?逆文本频率 相似度 文本表示 特征扩展
年,卷(期) 2020,(4) 所属期刊栏目 实践与应用
研究方向 页码范围 70-73
页数 4页 分类号 TP311
字数 语种 中文
DOI 10.15908/j.cnki.cist.2020.04.012
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 卢俊宇 1 0 0.0 0.0
2 周翔翔 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (79)
共引文献  (118)
参考文献  (8)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1973(2)
  • 参考文献(0)
  • 二级参考文献(2)
1975(4)
  • 参考文献(0)
  • 二级参考文献(4)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(7)
  • 参考文献(0)
  • 二级参考文献(7)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(8)
  • 参考文献(0)
  • 二级参考文献(8)
2010(6)
  • 参考文献(0)
  • 二级参考文献(6)
2011(6)
  • 参考文献(0)
  • 二级参考文献(6)
2012(8)
  • 参考文献(1)
  • 二级参考文献(7)
2013(5)
  • 参考文献(1)
  • 二级参考文献(4)
2014(4)
  • 参考文献(0)
  • 二级参考文献(4)
2015(8)
  • 参考文献(2)
  • 二级参考文献(6)
2016(2)
  • 参考文献(0)
  • 二级参考文献(2)
2017(6)
  • 参考文献(2)
  • 二级参考文献(4)
2018(4)
  • 参考文献(1)
  • 二级参考文献(3)
2019(4)
  • 参考文献(1)
  • 二级参考文献(3)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Word2vec
词频?逆文本频率
相似度
文本表示
特征扩展
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
指挥信息系统与技术
双月刊
1674-909X
32-1818/TP
16开
南京1406信箱62分箱
28-430
2010
chi
出版文献量(篇)
1287
总下载数(次)
8
总被引数(次)
4322
论文1v1指导