基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了一种错误抑制的多策略算法对齐汉维语句子.针对长度对齐算法无法避免错误蔓延的特点,提出了一种新的错误蔓延抑制策略:利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,结合句子长度特征,寻找1:1模式的句对作为锚点,将错误蔓延抑制在锚点内;在锚点之问,利用标点符号和长度混合方法进行句子对齐.算法实验结果验证了该多策略算法寻找的锚点的精度高,有效抑制了对齐错误的蔓延;采用的混合对齐算法,避免了基于词汇对齐算法的高时间复杂度的弱点,比传统的对齐算法性能有了较大提高,对齐准确率由95.0%提高到97.6%,召回率由96.8%提高到98.2%,采用的对齐正确性评价算法可以有效发现自动对齐中的噪音对齐.
推荐文章
混合策略的汉维句子对齐
双语语料
句子对齐
混合策略
改进的自适应汉维句子对齐
双语语料
句子对齐
自适应
基于锚点句对的汉维句子对齐方法
平行语料库
句子对齐
锚点
基于长度的方法
基于词汇的方法
基于互译特征词对匹配的老-汉双语句子相似度计算方法研究
老-汉双语词典
相似度计算
算法改进
双语句对识别
词汇互译
实验验证
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 多策略汉维句子对齐
来源期刊 计算机科学 学科 工学
关键词 双语语料 错误抑制 句子时齐 混合策略 汉维句子
年,卷(期) 2010,(4) 所属期刊栏目 人工智能
研究方向 页码范围 215-218,292
页数 分类号 TP391
字数 4558字 语种 中文
DOI 10.3969/j.issn.1002-137X.2010.04.054
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 禹龙 新疆大学网络中心 82 301 9.0 13.0
2 吐尔根·依布拉音 新疆大学信息科学与工程学院 116 771 14.0 22.0
3 田生伟 新疆大学信息科学与工程学院 101 343 9.0 13.0
4 杨飞宇 新疆大学国际文化交流学院 3 14 2.0 3.0
5 加米拉·吾守尔 新疆大学信息科学与工程学院 9 21 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (27)
参考文献  (3)
节点文献
引证文献  (10)
同被引文献  (22)
二级引证文献  (11)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(3)
  • 引证文献(3)
  • 二级引证文献(0)
2012(4)
  • 引证文献(2)
  • 二级引证文献(2)
2013(1)
  • 引证文献(0)
  • 二级引证文献(1)
2014(2)
  • 引证文献(1)
  • 二级引证文献(1)
2015(4)
  • 引证文献(2)
  • 二级引证文献(2)
2016(3)
  • 引证文献(1)
  • 二级引证文献(2)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(2)
  • 引证文献(1)
  • 二级引证文献(1)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
双语语料
错误抑制
句子时齐
混合策略
汉维句子
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导