基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文本聚类在数据挖掘和机器学习中发挥着重要作用,该技术经过多年的发展,已产生了一系列的理论成果。传统向量空间模型的文本建模方法存在维度高、数据稀疏和缺乏语义信息等问题,然而仅仅引入词典的文本建模部分解决了语义问题却又受限于人工词典词量少、人工耗力大等多种问题。文中借鉴主题模型的思想,提出一种以word2vec算法得到词向量为基础,词聚类的类别为主题,结合文本中主题的频率、分布范围、位置因子等特征以获得文本在类别空间上的特征向量,完成文本建模的方法word2fea。将其与两种文本建模方法VSM和word2vec base进行比较,实验结果表明该方法能够明显提高文本分类准确率。
推荐文章
基于word2vec和双向LSTM的情感分类深度模型
文本分类
情感分析
双向长短时记忆循环神经网络
词向量
社交网络
word2vec-ACV:OOV语境含义的词向量生成模型
word2vec模型
词向量
共现矩阵
平均上下文词向量
一种基于word2vec的文本分类方法
word2vec
词向量
文本分类
降维
相似度阈值
基于word2vec的跨领域情感分类方法
语义特征
共现特征
词向量
跨领域情感分类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Word2 fea模型的文本建模方法
来源期刊 计算机技术与发展 学科 工学
关键词 word2vec 文本建模 文本分类 word2fea
年,卷(期) 2016,(2) 所属期刊栏目 应用开发研究
研究方向 页码范围 165-167,173
页数 4页 分类号 TP301
字数 2592字 语种 中文
DOI 10.3969/j.issn.1673-629X.2016.02.037
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 韩立新 河海大学计算机与信息学院 47 272 9.0 15.0
2 夏建华 河海大学计算机与信息学院 3 2 1.0 1.0
3 卫华 河海大学计算机与信息学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (43)
共引文献  (333)
参考文献  (10)
节点文献
引证文献  (1)
同被引文献  (3)
二级引证文献  (7)
1973(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(4)
  • 参考文献(1)
  • 二级参考文献(3)
1983(1)
  • 参考文献(1)
  • 二级参考文献(0)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(2)
  • 参考文献(1)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(4)
  • 参考文献(1)
  • 二级参考文献(3)
2004(4)
  • 参考文献(1)
  • 二级参考文献(3)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(6)
  • 参考文献(0)
  • 二级参考文献(6)
2012(4)
  • 参考文献(1)
  • 二级参考文献(3)
2013(4)
  • 参考文献(2)
  • 二级参考文献(2)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(2)
  • 引证文献(1)
  • 二级引证文献(1)
2019(4)
  • 引证文献(0)
  • 二级引证文献(4)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
word2vec
文本建模
文本分类
word2fea
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导