基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了对网站主题高效的进行分类,建立一种基于word2vec的分类模型.针对预先定义的财经、娱乐、军事、科技、健康、体育、教育、社会共八个主题,首先通过word2vec训练得到包含语义的词向量.根据八个主题分别列举对应的特征词,将每个主题的特征词对应的词向量取平均作为该主题的中心词向量.对于待测网站文本,通过DBSCAN聚类提升文本的数据质量,计算文本与各主题的余弦相似度,取最大的作为该文本的所属主题.实验采用8000个文档进行测试,实验结果表明,利用该方法可以高效地对网页文本主题进行分类,有助于更好地了解人们的阅读偏好.
推荐文章
基于word2vec和双向LSTM的情感分类深度模型
文本分类
情感分析
双向长短时记忆循环神经网络
词向量
社交网络
基于LDA和word2vec的英文作文跑题检测
作文跑题检测
向量空间模型
潜在狄利克雷分配
词语间语义关系
基于word2vec的跨领域情感分类方法
语义特征
共现特征
词向量
跨领域情感分类
基于word2vec的数字图书馆本体构建技术研究
本体构建
领域本体
概念抽取
关系抽取
数字图书馆现状
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于word2vec的网站主题分类研究?
来源期刊 计算机与数字工程 学科 工学
关键词 网站分类 word2vec 词向量 DBSCAN 余弦相似度
年,卷(期) 2019,(1) 所属期刊栏目 信息处理与网络安全
研究方向 页码范围 169-173
页数 5页 分类号 TP181
字数 3757字 语种 中文
DOI 10.3969/j.issn.1672-9722.2019.01.036
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 程光 东南大学计算机科学与工程学院 59 1001 16.0 31.0
2 程元堃 2 11 2.0 2.0
6 蒋言 1 8 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (64)
共引文献  (231)
参考文献  (11)
节点文献
引证文献  (8)
同被引文献  (0)
二级引证文献  (0)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(5)
  • 参考文献(0)
  • 二级参考文献(5)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(4)
  • 参考文献(1)
  • 二级参考文献(3)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(7)
  • 参考文献(0)
  • 二级参考文献(7)
2008(6)
  • 参考文献(1)
  • 二级参考文献(5)
2009(4)
  • 参考文献(1)
  • 二级参考文献(3)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(3)
  • 参考文献(0)
  • 二级参考文献(3)
2012(5)
  • 参考文献(0)
  • 二级参考文献(5)
2013(5)
  • 参考文献(2)
  • 二级参考文献(3)
2014(6)
  • 参考文献(1)
  • 二级参考文献(5)
2015(3)
  • 参考文献(2)
  • 二级参考文献(1)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(8)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(8)
  • 二级引证文献(0)
2019(8)
  • 引证文献(8)
  • 二级引证文献(0)
研究主题发展历程
节点文献
网站分类
word2vec
词向量
DBSCAN
余弦相似度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与数字工程
月刊
1672-9722
42-1372/TP
大16开
武汉市东湖新技术开发区凤凰产业园藏龙北路1号
1973
chi
出版文献量(篇)
9945
总下载数(次)
28
总被引数(次)
47579
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导