基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出一种基于判别模型的拼写校正方法.它针对已有拼写校正系统Aspell的输出进行重排序,使用判别模型Ranking SVM来改进其性能.将现今较为成熟的拼写校正技术(包括编辑距离、基于字母的n元语法、发音相似度和噪音信道模型)以特征的形式整合到该模型中来,显著地提高了基准系统Aspell的初始排序质量,同时性能也超过了一些商用系统(如MicrosoR Word 2003)的拼写校正模块.此外,还提出了一种在搜索引擎查询日志链中自动抽取拼写校正训练对的方法.基于这种方法训练的模型获得了基于人工标注数据所得结果相近的性能,它们分别将基准系统的错误率降低了32.2%和32.6%.
推荐文章
一种基于属性分割的产生式/判别式混合分类器
分类
产生式
判别式
属性分割
遗传算法
一种基于标准白板的颜色校正方法
三原色
标准白板
颜色校正
校正系数
一种新的趋肤效应校正方法
感应测井
趋肤效应
校正
双频率
视电导率
一种新的车牌倾斜校正方法
车牌
倾斜校正
水平彩色边缘
垂直彩色边缘
投影
双线性插值
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于判别式重排序的拼写校正方法
来源期刊 软件学报 学科 工学
关键词 拼写校正 判别模型 重排序 日志挖掘 查询链
年,卷(期) 2008,(3) 所属期刊栏目 系统软件与软件工程
研究方向 页码范围 557-564
页数 8页 分类号 TP391
字数 7343字 语种 中文
DOI 10.3724/SP.J.1001.2008.00557
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 何丕廉 天津大学计算机科学与技术学院 107 1570 21.0 35.0
2 张扬 天津大学计算机科学与技术学院 9 44 4.0 6.0
3 李沐 5 15 2.0 3.0
4 向伟 香港科技大学计算机系 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (8)
共引文献  (1)
参考文献  (5)
节点文献
引证文献  (2)
同被引文献  (2)
二级引证文献  (2)
1964(1)
  • 参考文献(1)
  • 二级参考文献(0)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(3)
  • 参考文献(1)
  • 二级参考文献(2)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
拼写校正
判别模型
重排序
日志挖掘
查询链
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
总被引数(次)
226394
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导