基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对机器翻译研究中缺乏主从对齐标注的问题,提出一种基于人工标注结合基于LSTM(长短期记忆)的汉英主从对齐语料标注方法,并开发语料标注平台.使用国际机器翻译提供的语料,从中选取12500句手工进行主从句及句子对齐的标注,将标注后的语料进行分词、词向量化操作,使用LSTM网络进行训练得到自动标注模型,并进行自动标注.为保证标注语料的质量,构建平行语料标注平台,在模型对语料进行标注后可由人工进行校对,与全人工标注语料相比,使用自动标注平台具有更高的效率.
推荐文章
视频自动标注系统中的文本对齐算法
动态时间对齐
DTW
文本
视频自动标注
基于汉英双语语料的语义精准抽取系统设计
语义抽取
系统设计
双语语料
制定抽取规则
精准抽取
性能测试
中医汉英双语语料库平台
中医
汉英双语语料库
语料匹配
B_树动态索引
构建大规模的汉英双语平行语料库
机器翻译
双语平行语料库
语料库构建
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 汉英主从对齐语料标注平台
来源期刊 电信快报 学科
关键词 汉语平行语料 主从对齐 标注平台 LSTM(长短期记忆) 语料库
年,卷(期) 2021,(8) 所属期刊栏目 论文选粹
研究方向 页码范围 41-46
页数 6页 分类号
字数 语种 中文
DOI 10.3969/j.issn.1006-1339.2021.08.010
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (32)
共引文献  (17)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(5)
  • 参考文献(1)
  • 二级参考文献(4)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(7)
  • 参考文献(1)
  • 二级参考文献(6)
2014(2)
  • 参考文献(0)
  • 二级参考文献(2)
2015(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(1)
  • 参考文献(0)
  • 二级参考文献(1)
2017(2)
  • 参考文献(1)
  • 二级参考文献(1)
2018(2)
  • 参考文献(0)
  • 二级参考文献(2)
2019(5)
  • 参考文献(1)
  • 二级参考文献(4)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
汉语平行语料
主从对齐
标注平台
LSTM(长短期记忆)
语料库
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电信快报
月刊
1006-1339
31-1273/TN
大16开
上海市平江路48号1号楼3层
4-208
1964
chi
出版文献量(篇)
2317
总下载数(次)
8
论文1v1指导