基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文本中存在的表达冗余、词汇误用和内容缺失等错误会显著影响文本语义的理解,当前解决上述文本错误的纠错模型存在两个主要的问题:当前的文本纠错模型主要基于编码器-解码器框架,解码速度较慢;许多工作将错误检测和修正分离成两个任务,没有形成统一的整体.为此,提出了一种基于层次化修正框架的文本纠错模型.首先,基于预训练模型建模得到文本的多种语义表示;其次,利用文本的语义表示识别出文本中错误的位置;最后,利用层次化修正框架计算精化的修正操作并完成对错误的修正.针对公开文本纠错数据集CONLL-14进行了相关实验,结果表明本文模型比所选取的对比模型有更快的解码速度和更高的召回率.
推荐文章
面向文本数字化的自动纠错方法
自动纠错
文本数字化
频率统计树
切分信息
表形码
基于动态文本窗口和权重动态分配的中文文本纠错方法
语义搭配
数据稀疏
动态文本窗口
权重动态分配
应用框架的层次泛化模型研究
应用框架
层次
模型
基于fcmpCNN模型的网络文本情感多分类标注
情感分析
情感多分类标注
卷积神经网络
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于层次化修正框架的文本纠错模型
来源期刊 电子学报 学科 工学
关键词 文本纠错 预训练模型 层次化修正框架 深度学习
年,卷(期) 2021,(2) 所属期刊栏目 科研通信
研究方向 页码范围 401-407
页数 7页 分类号 TP391
字数 语种 中文
DOI 10.12263/DZXB.20200448
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本纠错
预训练模型
层次化修正框架
深度学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子学报
月刊
0372-2112
11-2087/TN
大16开
北京165信箱
2-891
1962
chi
出版文献量(篇)
11181
总下载数(次)
11
总被引数(次)
206555
论文1v1指导