语言建模中最小化样本风险算法的研究和改进

步丰林; 袁伟; 高剑峰

文献导航

搜索文章

搜索思路

钛学术文献服务平台 \
学术期刊 \
工业技术期刊 \
自动化技术与计算机技术期刊 \
软件学报期刊 \
语言建模中最小化样本风险算法的研究和改进

语言建模中最小化样本风险算法的研究和改进

作者：

步丰林袁伟高剑峰

基本信息来源于合作网站，原文需代理用户跳转至来源网站获取

语言建模

判别训练算法

输入法编辑器

最小化样本风险

领域适应性建模

摘要：

目前,一些主流的判别学习算法只能优化光滑可导的损失函数,但在自然语言处理(natural language processing,简称NLP)中,很多应用的直接评价标准(如字符转换错误数(character error rate,简称CER))都是不可导的阶梯形函数.为解决此问题,研究了一种新提出的判别学习算法--最小化样本风险(minimum sample risk,简称MSR)算法.与其他判别训练算法不同,MSR算法直接使用阶梯形函数作为其损失函数.首先,对MSR算法的时空复杂性作了分析和提高;同时,提出了改进的算法MSR-II,使得特征之间相关性的计算更加稳定.此外,还通过大量领域适应性建模实验来考察MSR-II的鲁棒性.日文汉字输入实验的评测结果表明:(1) MSR/MSR-II显著优于传统三元模型,使错误率下降了20.9%;(2) MSR/MSR-II与另两类主流判别学习算法Boosting和Perceptron表现相当;(3) MSR-II不仅在时空复杂度上优于MSR,特征选择的稳定性也更高;(4) 领域适应性建模的结果证明了MSR-II的良好鲁棒性.总之,MSR/MSR-II是一种非常有效的算法.由于其使用的是阶梯形的损失函数,因此可以广泛应用于自然语言处理的各个领域,如拼写校正和机器翻译.

内容分析

关键词云

关键词热度

相关文献

推荐文献

根据相关规定，获取原文需跳转至原文服务方进行注册认证身份信息

完成下面三个步骤操作后即可获取文献，阅读后请点击下方页面【继续获取】按钮

钛学术文献服务平台

学术出版新技术应用与公共服务实验室出品

原文合作方

获取文献流程

1.访问原文合作方请等待几秒系统会自动跳转至登录页，首次访问请先注册账号，填写基本信息后，点击【注册】

2.注册后进行实名认证，实名认证成功后点击【返回】

3.检查邮箱地址是否正确，若错误或未填写请填写正确邮箱地址，点击【确认支付】完成获取，文献将在1小时内发送至您的邮箱

*若已注册过原文合作方账号的用户，可跳过上述操作，直接登录后获取原文即可

点击【获取原文】按钮，跳转至合作网站。

首次获取需要在合作网站进行注册。

注册并实名认证，认证后点击【返回】按钮。

确认邮箱信息，点击【确认支付】，订单将在一小时内发送至您的邮箱。

* 若已经注册过合作网站账号，请忽略第二、三步，直接登录即可。

期刊分类
期刊（年）
期刊（期）
期刊推荐

一般工业技术交通运输军事科技冶金工业动力工程化学工业原子能技术大学学报建筑科学无线电电子学与电信技术机械与仪表工业水利工程环境科学与安全科学电工技术石油与天然气工业矿业工程自动化技术与计算机技术航空航天轻工业与手工业金属学与金属工艺

软件学报2022 软件学报2021 软件学报2020 软件学报2019 软件学报2018 软件学报2017 软件学报2016 软件学报2015 软件学报2014 软件学报2013 软件学报2012 软件学报2011 软件学报2010 软件学报2009 软件学报2008 软件学报2007 软件学报2006 软件学报2005 软件学报2004 软件学报2003 软件学报2002 软件学报2001 软件学报2000 软件学报1999 软件学报1998

软件学报2007年第9期软件学报2007年第8期软件学报2007年第7期软件学报2007年第6期软件学报2007年第5期软件学报2007年第4期软件学报2007年第3期软件学报2007年第2期软件学报2007年第12期软件学报2007年第11期软件学报2007年第10期软件学报2007年第1期

计算机工程与应用计算机工程计算机应用研究软件学报计算机应用计算机学报系统仿真学报计算机研究与发展计算机工程与设计计算机科学控制与决策电脑知识与技术计算机集成制造系统计算机仿真自动化学报计算机技术与发展计算机应用与软件计算机辅助设计与图形学学报小型微型计算机系统控制理论与应用控制理论与应用遥感学报传感器与微系统传感技术学报制造业自动化微电子学与计算机计算机工程与科学机器人计算机系统应用计算机与现代化测控技术计算机与数字工程工业控制计算机测绘与空间地理信息电机与控制学报中文信息学报福建电脑控制工程遥感技术与应用信息与控制

按字母查找期刊：

A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他

联系合作广告推广: shenyukuan@paperpass.com

篇名	语言建模中最小化样本风险算法的研究和改进
来源期刊	软件学报	学科	工学
关键词	语言建模判别训练算法输入法编辑器最小化样本风险领域适应性建模
年，卷（期）	2007,（2）	所属期刊栏目	算法设计与分析
研究方向		页码范围	196-204
页数	9页	分类号	TP391
字数	9103字	语种	中文
DOI

序号	姓名	单位	发文数	被引次数	H指数	G指数
1	步丰林	上海交通大学计算机科学与工程系	25	277	8.0	16.0
2	袁伟	上海交通大学计算机科学与工程系	4	11	2.0	3.0