基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文本特征提取对短文本聚类效果至关重要,针对传统的基于统计学习的特征提取方法仅停留在特征询的层面,无法表达文本上下文语义特征的问题.基于此,笔者提出了一种基于 word2vec词向量和卷积神经网络(Convolutional Neural Networks,CNN)的文本特征提取方法用于短文本聚类,首先利用 word2vec工具训练大规模语料库中的词语,以低维向量的形式表征,然后利用 CNN提取文本的深层语义特征,得到能够用于聚类的文本特征向量.实验结果表明,该方法可以有效提升短文本聚类的准确性.
推荐文章
基于word2vec和双向LSTM的情感分类深度模型
文本分类
情感分析
双向长短时记忆循环神经网络
词向量
社交网络
基于LDA和word2vec的英文作文跑题检测
作文跑题检测
向量空间模型
潜在狄利克雷分配
词语间语义关系
Word2vec-CNN-Bilstm短文本情感分类
神经网络
情感分类
词向量
短文本
基于word2vec的数字图书馆本体构建技术研究
本体构建
领域本体
概念抽取
关系抽取
数字图书馆现状
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于word2vec和CNN的短文本聚类研究
来源期刊 信息与电脑 学科 工学
关键词 CNN word2vec 短文本聚类 特征提取
年,卷(期) 2019,(24) 所属期刊栏目 算法语言
研究方向 页码范围 20-22
页数 3页 分类号 TP391.1
字数 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 尹光花 3 3 1.0 1.0
2 杨俊峰 2 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (17)
共引文献  (2)
参考文献  (1)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(4)
  • 参考文献(0)
  • 二级参考文献(4)
2014(3)
  • 参考文献(0)
  • 二级参考文献(3)
2015(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(5)
  • 参考文献(0)
  • 二级参考文献(5)
2017(2)
  • 参考文献(0)
  • 二级参考文献(2)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
CNN
word2vec
短文本聚类
特征提取
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息与电脑
半月刊
1003-9767
11-2697/TP
北京市东城区北河沿大街79号
chi
出版文献量(篇)
16624
总下载数(次)
72
总被引数(次)
19907
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导