基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
该文收集了自晚清到21世纪间长达144年的连续历时报刊语料,通过统计分析和词语分布式表示两类方法展开研究,计算并辅助识别汉语词语的词义历时演变现象.采用TF-IDF、词频比例等多种统计分析的评价指标和目标词语在文段中的共现实词及其重合度挖掘出现词义演变的词语.针对历时语料上不同时间段的词向量对齐,采用SGNS训练词向量加正交矩阵投影、SGNS递增训练和"锚点词"二阶词向量表示三种方法,其中以SGNS递增训练效果最佳.针对自动发现的词义演变现象,采用目标词历时自相似度和锚点词历时相似度的分析方法,并利用近邻词来明确目标词变迁前后的词义.
推荐文章
词义演化的计算方法
词义演化
词义计算
动态语料库
基于nGram2vec与词义演化的词相似度计算方法
词相似度
nGram2vec
同义词林
知网
词义演化
感官形容词词义演变分析
感官形容词
词义转移
生理学共性
文化差异
通感
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于长时间跨度语料的词义演变计算研究
来源期刊 中文信息学报 学科 工学
关键词 词义演变 历时语料 分布式表示
年,卷(期) 2020,(8) 所属期刊栏目 语言分析与计算
研究方向 页码范围 10-22
页数 13页 分类号 TP391
字数 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (91)
共引文献  (30)
参考文献  (7)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1952(1)
  • 参考文献(0)
  • 二级参考文献(1)
1953(1)
  • 参考文献(0)
  • 二级参考文献(1)
1958(1)
  • 参考文献(0)
  • 二级参考文献(1)
1960(1)
  • 参考文献(0)
  • 二级参考文献(1)
1962(1)
  • 参考文献(0)
  • 二级参考文献(1)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1981(1)
  • 参考文献(0)
  • 二级参考文献(1)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1984(2)
  • 参考文献(0)
  • 二级参考文献(2)
1985(2)
  • 参考文献(0)
  • 二级参考文献(2)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(3)
  • 参考文献(0)
  • 二级参考文献(3)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(3)
  • 参考文献(0)
  • 二级参考文献(3)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(5)
  • 参考文献(0)
  • 二级参考文献(5)
2004(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(6)
  • 参考文献(0)
  • 二级参考文献(6)
2007(9)
  • 参考文献(0)
  • 二级参考文献(9)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(3)
  • 参考文献(1)
  • 二级参考文献(2)
2010(6)
  • 参考文献(2)
  • 二级参考文献(4)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(5)
  • 参考文献(0)
  • 二级参考文献(5)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(4)
  • 参考文献(0)
  • 二级参考文献(4)
2015(3)
  • 参考文献(1)
  • 二级参考文献(2)
2016(4)
  • 参考文献(1)
  • 二级参考文献(3)
2017(3)
  • 参考文献(1)
  • 二级参考文献(2)
2018(3)
  • 参考文献(0)
  • 二级参考文献(3)
2019(5)
  • 参考文献(0)
  • 二级参考文献(5)
2020(1)
  • 参考文献(0)
  • 二级参考文献(1)
2020(1)
  • 参考文献(0)
  • 二级参考文献(1)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
词义演变
历时语料
分布式表示
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
论文1v1指导