作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着微博等社交网络的普及,新词源源不断涌现,分词系统经常将新词错误切分为单字。新词发现已经成为中文自然语言处理领域的研究热点。现有新词识别方法依赖大规模语料统计数据,对低频新词识别能力差。本文提出一种扩展Skip-gram模型和词向量投影方法,将两者结合后能缓解自然语言处理中常见的数据稀疏问题,有效识别低频新词,进而提高分词系统的准确率和召回率。
推荐文章
基于Skip-gram模型的微博情感倾向性分析
微博
情感分析
Skip-gram模型
词向量
微博向量
基于词向量的微博事件追踪方法
微博
事件追踪
短文本
Skip-gram模型
词向量
语义信息
基于连续Skip-gram及深度学习的图像描述方法
深度学习
图像描述生成
Skip-gram
词向量
基于词向量的微博话题发现方法
话题发现
词向量
短文本
Canopy聚类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Skip-Gram模型融合词向量投影的微博新词发现
来源期刊 计算机系统应用 学科
关键词 skip-gram SOM 词向量 微博 新词发现
年,卷(期) 2016,(7) 所属期刊栏目
研究方向 页码范围 130-136
页数 7页 分类号
字数 5563字 语种 中文
DOI 10.15888/j.cnki.csa.005236
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 于洁 福建信息职业技术学院计算机工程系 7 11 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (29)
共引文献  (282)
参考文献  (11)
节点文献
引证文献  (6)
同被引文献  (29)
二级引证文献  (8)
1982(1)
  • 参考文献(1)
  • 二级参考文献(0)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(3)
  • 参考文献(1)
  • 二级参考文献(2)
2003(2)
  • 参考文献(2)
  • 二级参考文献(0)
2004(6)
  • 参考文献(1)
  • 二级参考文献(5)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(5)
  • 参考文献(1)
  • 二级参考文献(4)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(2)
  • 参考文献(1)
  • 二级参考文献(1)
2014(2)
  • 参考文献(1)
  • 二级参考文献(1)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(6)
  • 引证文献(3)
  • 二级引证文献(3)
2019(4)
  • 引证文献(1)
  • 二级引证文献(3)
2020(4)
  • 引证文献(2)
  • 二级引证文献(2)
研究主题发展历程
节点文献
skip-gram
SOM
词向量
微博
新词发现
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
总被引数(次)
57078
论文1v1指导