作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
语言监测是语言规划学的基础任务。一定时间范围内的热词或关键词则是语言监测工作的重要研究对象。目前向前挖掘历史热词的工作较少。本文采用计算语言学中广泛使用的隐含主题建模方法,对第二次世界大战后70年的大陆中文报刊历时语料库进行了主题词簇的抽取,获得了相应时间段的时代热词与年度词。相比于依照频率排序的方法,使用隐含主题模型的方法获得的热词与历史直观较为吻合。所提取出的2006年以后的热词与'汉语盘点'活动中的专家与投票相结合所获得的评选结果有较好可比性。这都验证了隐含主题模型加少量人工修正的方法在历时热词提取方面的性能。
推荐文章
基于现代汉语语料库报刊类的色彩词隐喻研究
色彩词
报刊类语料
隐喻喻义
海内外隐喻差异
融合词向量特征的双词主题模型
主题模型
潜在狄利克雷分配
短文本
双词主题模型
词向量
吉布斯采样
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 时代精神:基于1946年到2015年报刊语料和隐含主题模型的历史热词提取
来源期刊 语言规划学研究 学科 文学
关键词 热词提取 隐含主题模型 语言监测 自动
年,卷(期) 2016,(2) 所属期刊栏目
研究方向 页码范围 40-58
页数 19页 分类号 H102
字数 语种
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 饶高琦 北京语言大学对外汉语研究中心 18 49 3.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
热词提取
隐含主题模型
语言监测
自动
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
语言规划学研究
半年刊
16开
北京市
2015
chi
出版文献量(篇)
151
总下载数(次)
2
总被引数(次)
37
论文1v1指导