基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基于记忆的自适应语言模型虽然在一定程度上增强了语言模型对不同领域的适应性,但其假设过于简单,即认为一个在文章的前面部分出现过的词往往会在后面重复出现.通过对一些文本的观察分析,我们认为作者在书写文章的时候,除了常常使用前文中出现过的词汇外,为了避免用词单调,还会在行文过程中使用前文出现过词汇的近义词或者同义词.另外,一篇文章总是围绕某个主题展开,所以在文章中出现的许多词汇往往在语义上有很大的相关性.我们对基于记忆的语言模型进行了扩展,利用汉语义类词典,将与缓存中所保留词汇语义上相近或者相关的词汇也引入缓存.实验表明这种改进在很大程度上提高了原有模型的性能,与n元语言模型相比困惑度下降了40.1%,有效地增强了语言模型的自适应性.
推荐文章
一种基于极值的自适应中值滤波改进算法
自适应
中值滤波
噪声
算法
基于指数加权的改进衰减记忆自适应滤波算法
目标跟踪
卡尔曼滤波
衰减记忆
自适应衰减因子
指数加权
交互式多模型
一种改进的MNVS自适应滤波算法
自适应滤波
变步长算法
最小均方误差法
一种改进的自适应蚁群聚类算法
聚类分析
蚁群算法
蚂蚁移动
自适应
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种改进的基于记忆的自适应汉语语言模型
来源期刊 中文信息学报 学科 工学
关键词 人工智能 自然语言处理 语言模型 自适应 同义词词林 困惑度
年,卷(期) 2005,(1) 所属期刊栏目
研究方向 页码范围 8-13
页数 6页 分类号 TP391
字数 4830字 语种 中文
DOI 10.3969/j.issn.1003-0077.2005.01.002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 孙玉芳 中国科学院软件研究所系统软件与中文信息中心 98 2323 27.0 45.0
2 孙乐 中国科学院软件研究所系统软件与中文信息中心 30 714 11.0 26.0
3 张俊林 中国科学院软件研究所系统软件与中文信息中心 8 80 6.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (3)
同被引文献  (0)
二级引证文献  (9)
1977(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
1991(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2006(1)
  • 引证文献(1)
  • 二级引证文献(0)
2007(2)
  • 引证文献(1)
  • 二级引证文献(1)
2008(1)
  • 引证文献(0)
  • 二级引证文献(1)
2009(1)
  • 引证文献(0)
  • 二级引证文献(1)
2010(3)
  • 引证文献(1)
  • 二级引证文献(2)
2012(1)
  • 引证文献(0)
  • 二级引证文献(1)
2013(2)
  • 引证文献(0)
  • 二级引证文献(2)
2014(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
人工智能
自然语言处理
语言模型
自适应
同义词词林
困惑度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
论文1v1指导