作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
N-gram模型是自然语言处理中最常用的语言模型之一,广泛应用于语音识别、手写识别、拼写纠错、机器翻译和搜索引擎等众多任务.但是N-gram模型在训练和应用时经常会出现零概率问题,导致无法获得良好的语言模型,因此出现了拉普拉斯平滑、卡茨回退和Kneser-Ney平滑等平滑方法.在介绍了这些平滑方法的基本原理后,使用困惑度作为度量标准去比较了基于这几种平滑方法所训练出的语言模型.
推荐文章
不同维度下维吾尔语N-gram语言模型性能分析
N-gram语言模型
性能分析
SRILM
MITLM
困惑度
平滑算法
机器翻译
基于N-Gram的文本去重方法研究
文本去重
文本特征
特征映射
中文信息处理
维语网页中n-gram模型结合类不平衡SVM的不良文本过滤方法
维吾尔语网页
不良文本过滤
n-gram词干提取
类不平衡SVM
基于N-gram算法的网络安全风险检测系统设计
网络安全
风险检测
N-gram算法
数据包检测
协同分析
特征匹配
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 N-gram模型综述
来源期刊 计算机系统应用 学科
关键词 N-gram模型 拉普拉斯平滑 卡茨回退 Kneser-Ney平滑 困惑度
年,卷(期) 2018,(10) 所属期刊栏目 专论·综述
研究方向 页码范围 33-38
页数 6页 分类号
字数 4385字 语种 中文
DOI 10.15888/j.cnki.csa.006560
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吴敏 中国科学技术大学软件学院 79 499 12.0 19.0
2 尹陈 中国科学技术大学软件学院 1 19 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (19)
同被引文献  (47)
二级引证文献  (0)
2018(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(13)
  • 引证文献(13)
  • 二级引证文献(0)
2020(5)
  • 引证文献(5)
  • 二级引证文献(0)
研究主题发展历程
节点文献
N-gram模型
拉普拉斯平滑
卡茨回退
Kneser-Ney平滑
困惑度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
论文1v1指导