基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
使用词向量表示方法能够很好的捕捉词语的语法和语义信息,为了能够提高词向量语义信息表示的准确性,本文通过分析GloVe模型共现矩阵的特点,利用分布式假设,提出了一种基于GloVe词向量训练模型的改进方法.该方法主要通过对维基百科统计词频分析,总结出过滤共现矩阵中无关词和噪声词的一般规律,最后给出了词向量在词语类比数据集和词语相关性数据集的评估结果.实验表明,在相同的实验环境中,本文的方法能够有效的缩短词向量的训练时间,并且在词语语义类比实验中准确率得到提高.
推荐文章
基于特征权重的词向量文本表示模型
TF-IDF模型
N-Gram模型
Glove模型
文本表示
融合词向量特征的双词主题模型
主题模型
潜在狄利克雷分配
短文本
双词主题模型
词向量
吉布斯采样
基于词向量与TextRank的关键词提取方法
抽取
语义差异性
TextRank
词向量
隐含主题分布
基于中心化相似度矩阵的词向量方法
词向量
中心化
相似度矩阵
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于GloVe模型的词向量改进方法
来源期刊 计算机系统应用 学科
关键词 词向量 Word2Vec GloVe 共现矩阵 无关词
年,卷(期) 2019,(1) 所属期刊栏目 软件技术·算法
研究方向 页码范围 194-199
页数 6页 分类号
字数 5894字 语种 中文
DOI 10.15888/j.cnki.csa.006704
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 丁治明 北京工业大学信息学部 10 83 4.0 9.0
2 陈珍锐 北京工业大学信息学部 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (10)
节点文献
引证文献  (3)
同被引文献  (1)
二级引证文献  (0)
1904(1)
  • 参考文献(1)
  • 二级参考文献(0)
1954(1)
  • 参考文献(1)
  • 二级参考文献(0)
1965(1)
  • 参考文献(1)
  • 二级参考文献(0)
1991(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(2)
  • 参考文献(2)
  • 二级参考文献(0)
2003(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
词向量
Word2Vec
GloVe
共现矩阵
无关词
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
相关基金
北京市科技计划项目
英文译名:
官方网址:
项目类型:
学科类型:
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导