基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
从可比语料中抽取伪平行句对是翻译语料扩充的重要方法之一.汉-越机器翻译是典型的资源稀缺型机器翻译,提高汉越翻译语料的规模能够显著提升汉越神经机器翻译性能.文章提出基于句子特征向量的汉越伪平行句对抽取方法,该方法首先根据汉越句法特性,将汉越句法差异部分的词性融入嵌入层,再使用自我注意力机制的神经网络抽取句子特征,生成一个句子特征向量,用这个句子特征向量来判断汉越句对是否为伪平行句对,实现从汉-越可比语料中抽取汉-越伪平行句对.实验表明,文章所提方法能够有效地从汉越可比语料中抽取出汉越伪平行句对.
推荐文章
基于句法差异的汉-越平行句对抽取
句法特征
平行句对抽取
孪生循环神经网络
汉-越机器翻译
切触伪度量流形的特征向量场
伪度量
切触结构
ξ-截曲率
共形Killing向量场
D-位似变换
基于互译特征词对匹配的老-汉双语句子相似度计算方法研究
老-汉双语词典
相似度计算
算法改进
双语句对识别
词汇互译
实验验证
方阵的模糊特征向量
模糊数
特征值
特征向量
模糊线性系统
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于句子特征向量的汉-越伪平行句对抽取
来源期刊 山西大学学报(自然科学版) 学科 工学
关键词 句子特征向量 自我注意力机制 伪平行句对抽取 汉越机器翻译
年,卷(期) 2019,(4) 所属期刊栏目 2019年中国计算机学会人工智能会议(CCFAI 2019)论文选登
研究方向 页码范围 770-776
页数 7页 分类号 TP391
字数 5569字 语种 中文
DOI 10.13451/j.cnki.shanxi.univ(nat.sci.).2019.06.03.009
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 余正涛 昆明理工大学信息工程与自动化学院云南省人工智能重点实验室 122 877 17.0 24.0
2 高盛祥 昆明理工大学信息工程与自动化学院云南省人工智能重点实验室 21 77 4.0 8.0
3 翟家欣 昆明理工大学信息工程与自动化学院云南省人工智能重点实验室 1 0 0.0 0.0
4 文永华 昆明理工大学信息工程与自动化学院云南省人工智能重点实验室 7 11 1.0 3.0
5 郭军军 昆明理工大学信息工程与自动化学院云南省人工智能重点实验室 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (5)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
句子特征向量
自我注意力机制
伪平行句对抽取
汉越机器翻译
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
山西大学学报(自然科学版)
季刊
0253-2395
14-1105/N
大16开
太原市坞城路92号
22-42
1960
chi
出版文献量(篇)
2646
总下载数(次)
7
总被引数(次)
12039
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导