基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对基于预训练得到的词向量在低频词语表示质量和稳定性等方面存在的缺陷, 提出一种基于 How-net 的词向量表示方法(H-WRL).首先, 基于义原独立性假设, 将 Hownet 中所有 N 个义原指定为欧式空间的一个标准正交基, 实现 Hownet 义原向量初始化; 然后, 根据 Hownet 中词语与义原之间的定义关系, 将词语向量表示视为相关义原所张成的子空间中的投影, 并提出学习词向量表示的深度神经网络模型.实验表明,基于 Hownet 的词向量表示在词相似度计算和词义消歧两项标准评测任务中均取得很好的效果.
推荐文章
基于fastText模型的词向量表示改进算法
词向量
skip-gram模型
fastText模型
自然语言处理
基于词向量的微博话题发现方法
话题发现
词向量
短文本
Canopy聚类
基于向量表示的代码搜索方法
代码向量表示
代码搜索
语义编码
余弦相似度
基于词对向量空间模型的新事件检测方法
向量空间模型
词对特征
新事件检测
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于 Hownet 的词向量表示方法
来源期刊 北京大学学报(自然科学版) 学科
关键词 词向量表示 Hownet 词语相似性计算 词义消岐
年,卷(期) 2019,(1) 所属期刊栏目 专题报道: 文本大数据分析与语义理解
研究方向 页码范围 22-28
页数 7页 分类号
字数 6823字 语种 中文
DOI 10.13209/j.0479-8023.2018.061
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 罗智勇 北京语言大学语言信息处理研究所 9 186 5.0 9.0
2 陈洋 北京语言大学信息科学学院 1 5 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (9)
参考文献  (5)
节点文献
引证文献  (5)
同被引文献  (19)
二级引证文献  (4)
1954(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(3)
  • 参考文献(1)
  • 二级参考文献(2)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(5)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(4)
  • 二级引证文献(1)
2019(5)
  • 引证文献(4)
  • 二级引证文献(1)
2020(4)
  • 引证文献(1)
  • 二级引证文献(3)
研究主题发展历程
节点文献
词向量表示
Hownet
词语相似性计算
词义消岐
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
北京大学学报(自然科学版)
双月刊
0479-8023
11-2442/N
16开
北京海淀北京大学校内
2-89
1955
chi
出版文献量(篇)
3152
总下载数(次)
8
总被引数(次)
52842
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导