基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
英语介词纠错系统,针对英语学习者英语语言中常见的介词错误进行计算机自动纠正.首先,对标注过得语料库中介词错误进行了分类统计,总结出21种常见介词,在英语wiki语料库中利用计算机自动错误插值算法获得训练集合.然后在训练集合基础之上,通过使用基于最大熵模型的分类器,选择了包括上下文、介词补足语等特征,在训练集上进行模型的训练,最后使用模型对于输入句子进行预测并纠正存在的使用错误.在NUCLE语料的实验中,给出了语料处理、模型特点、训练语料的大小、迭代次数对于测试集效果的影响,并且比较了朴素贝叶斯模型的结果,最后在测试数据达到27.68的F值,相对于CoNLL2013的shared task中最好结果有小幅提升.
推荐文章
基于最大熵模型的中文指代消解系统实现
自然语言处理
指代消解
最大熵
基于最大熵模型的评价搭配识别
倾向性
评价搭配
最大熵
极性词表
评价词语类别
语义特征
基于最大信息熵模型的异常流量分类方法
最大信息熵模型
异常流量
离散化
特征选择
参数估计
基于最大熵模型的垃圾邮件过滤技术
垃圾邮件
最大熵
特征值
邮件过滤
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于最大熵模型的介词纠错系统
来源期刊 计算机系统应用 学科
关键词 介词错误 计算机自动纠正 最大熵模型
年,卷(期) 2016,(1) 所属期刊栏目 系统建设
研究方向 页码范围 96-100
页数 5页 分类号
字数 4223字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吴敏 中国科学技术大学现代教育技术中心 79 499 12.0 19.0
2 吴桂兴 中国科学技术大学苏州研究院 10 13 2.0 3.0
3 郭燕 中国科学技术大学苏州研究院 13 22 2.0 4.0
4 李悦 中国科学技术大学现代教育技术中心 18 43 4.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
介词错误
计算机自动纠正
最大熵模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
总被引数(次)
57078
论文1v1指导