基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着自然语言处理技术的发展和大规模语料库的出现,各类自然语言应用中使用的语言模型规模也越来越大。IRSTLM①在训练语言模型时采用了划分词典分块训练快速合并的方式,从而在训练大规模语料时取得了优异的性能。但它受限于训练方式,难以估算精确概率。本文在分析和重实现IRSTLM的基础上提出了一种方法,可以用来修正合并后的语言模型。在机器翻译上的实验表明,该方案有助于改进生成的语言模型的质量。同时,本项实验还填补了java平台上语言模型训练和使用工具的空白。
推荐文章
对ARAP协议的分析与改进
无线射频识别
ARAP协议
身份认证
抵抗假冒攻击
对哈希算法SHA-1的分析和改进
哈希算法
SHA-1
安全
散列值
对改进的无线认证协议SSM的分析
SSM协议
串空间
机密性
认证性
EAP-AKA协议的分析和改进
3G
WLAN
EAP-AKA
认证
密钥分配
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 对IRSTLM的分析和改进
来源期刊 心智与计算 学科 工学
关键词 语言模型 IRSTLM 机器翻译 JAVA
年,卷(期) 2008,(1) 所属期刊栏目
研究方向 页码范围 8-15
页数 8页 分类号 TP391.1
字数 语种
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 史晓东 厦门大学人工智能研究所 31 290 8.0 16.0
2 陈毅东 厦门大学人工智能研究所 28 111 6.0 8.0
3 张润延 厦门大学人工智能研究所 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (36)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
语言模型
IRSTLM
机器翻译
JAVA
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
心智与计算
季刊
2007
chi;eng
出版文献量(篇)
193
总下载数(次)
93997
总被引数(次)
820
论文1v1指导