基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了对饮食文本信息高效分类,建立一种基于word2vec和长短期记忆网络(Long-short term memory,LSTM)的分类模型.针对食物百科和饮食健康文本特点,首先利用word2vec实现包含语义信息的词向量表示,并解决了传统方法导致数据表示稀疏及维度灾难问题,基于K-means++根据语义关系聚类以提高训练数据质量.由word2vec构建文本向量作为LSTM的初始输入,训练LSTM分类模型,自动提取特征,进行饮食宜、忌的文本分类.实验采用48 000个文档进行测试,结果显示,分类准确率为98.08%,高于利用tf-idf、bag-of-words等文本数值化表示方法以及基于支持向量机(Support vector machine,SVM)和卷积神经网络(Convolutional neural network,CNN)分类算法结果.实验结果表明,利用该方法能够高质量地对饮食文本自动分类,帮助人们有效地利用健康饮食信息.
推荐文章
基于word2vec和双向LSTM的情感分类深度模型
文本分类
情感分析
双向长短时记忆循环神经网络
词向量
社交网络
基于LDA和word2vec的英文作文跑题检测
作文跑题检测
向量空间模型
潜在狄利克雷分配
词语间语义关系
一种基于word2vec的文本分类方法
word2vec
词向量
文本分类
降维
相似度阈值
基于word2vec的跨领域情感分类方法
语义特征
共现特征
词向量
跨领域情感分类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于word2vec和LSTM的饮食健康文本分类研究
来源期刊 农业机械学报 学科 工学
关键词 文本分类 word2vec 词向量 长短期记忆网络 K-means++
年,卷(期) 2017,(10) 所属期刊栏目 农业信息化工程
研究方向 页码范围 202-208
页数 7页 分类号 TP182
字数 6266字 语种 中文
DOI 10.6041/j.issn.1000-1298.2017.10.025
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 赵明 中国农业大学信息与电气工程学院 172 4205 37.0 58.0
2 陈长松 11 130 5.0 11.0
3 杜会芳 中国农业大学信息与电气工程学院 2 46 2.0 2.0
4 董翠翠 中国农业大学信息与电气工程学院 2 46 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (84)
共引文献  (99)
参考文献  (11)
节点文献
引证文献  (37)
同被引文献  (120)
二级引证文献  (36)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(1)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(6)
  • 参考文献(0)
  • 二级参考文献(6)
2010(8)
  • 参考文献(1)
  • 二级参考文献(7)
2011(12)
  • 参考文献(0)
  • 二级参考文献(12)
2012(14)
  • 参考文献(0)
  • 二级参考文献(14)
2013(16)
  • 参考文献(0)
  • 二级参考文献(16)
2014(12)
  • 参考文献(2)
  • 二级参考文献(10)
2015(8)
  • 参考文献(4)
  • 二级参考文献(4)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(10)
  • 引证文献(10)
  • 二级引证文献(0)
2019(35)
  • 引证文献(24)
  • 二级引证文献(11)
2020(28)
  • 引证文献(3)
  • 二级引证文献(25)
研究主题发展历程
节点文献
文本分类
word2vec
词向量
长短期记忆网络
K-means++
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
农业机械学报
月刊
1000-1298
11-1964/S
大16开
北京德外北沙滩1号6信箱
2-363
1957
chi
出版文献量(篇)
11867
总下载数(次)
31
总被引数(次)
174483
论文1v1指导