基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
低资源环境下,受限于平行语料的规模和质量,神经机器翻译的效果并不理想.汉-越神经机器翻译作为典型的低资源型机器翻译,同样面临平行语料匮乏的问题.针对这一问题提出了基于句法差异的汉-越平行句对抽取方法.一方面,分析了汉语和越南语间的句法差异,通过词性标签对差异进行表述;另一方面,利用孪生结构的循环神经网络,在编码过程中融入句法差异信息,从句法规则角度更好的指导抽取过程.实验表明,基于汉越可比语料所提方法能够有效地抽取出高质量汉越平行句对.
推荐文章
基于句子特征向量的汉-越伪平行句对抽取
句子特征向量
自我注意力机制
伪平行句对抽取
汉越机器翻译
金融领域的事件句抽取
公司名识别
事件句
简称
事件抽取
基于句法树结构的情感评价单元抽取算法
情感分析
情感评价单元
句法树
卷积树核
相似度计算
商品评价
基于CRF算法的汉语比较句识别和关系抽取
比较句
比较关系
CRF模型
比较主体
比较基准
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于句法差异的汉-越平行句对抽取
来源期刊 云南民族大学学报(自然科学版) 学科 工学
关键词 句法特征 平行句对抽取 孪生循环神经网络 汉-越机器翻译
年,卷(期) 2020,(4) 所属期刊栏目 大数据与机器学习
研究方向 页码范围 366-370
页数 5页 分类号 TP391.1
字数 3512字 语种 中文
DOI 10.3969/j.issn.1672-8513.2020.04.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 高明虎 云南民族大学信息与网络中心 13 14 2.0 3.0
2 于志强 云南民族大学信息与网络中心 5 10 2.0 3.0
3 陈宇星 云南民族大学信息与网络中心 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (1)
共引文献  (44)
参考文献  (4)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
句法特征
平行句对抽取
孪生循环神经网络
汉-越机器翻译
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
云南民族大学学报(自然科学版)
双月刊
1672-8513
53-1192/N
大16开
中国昆明市一二·一大街134号
1992
chi
出版文献量(篇)
2286
总下载数(次)
5
总被引数(次)
8502
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导