基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
该文探讨了汉语与维吾尔语原始语料处理中切分句子与对齐句子的难点及解决方案,提出了一种用于汉维平行语料库对齐的混合方法及回归校验法.该文基于锚点结合词典的方法进行句子对齐,并基于长度模型用普通最小二乘法做线性回归分析,计算相关系数、确定阈值并拟合最佳拟合直线,自动校验排错,继而建立汉维双语平行语料库.实验表明,本文方法有效提高了句子对齐的正确率与召回率,提高了汉维平行语料库的构建效率.
推荐文章
混合策略的汉维句子对齐
双语语料
句子对齐
混合策略
改进的自适应汉维句子对齐
双语语料
句子对齐
自适应
基于锚点句对的汉维句子对齐方法
平行语料库
句子对齐
锚点
基于长度的方法
基于词汇的方法
基于词典和句长及位置的双语对齐方法的改进
句子对齐
期望值
双语语料库
锚点
长度和位置
词典
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于混合方法及回归校验的汉维句子对齐
来源期刊 电视技术 学科 工学
关键词 平行语料库 句子对齐 线性回归 翻译语料
年,卷(期) 2019,(13) 所属期刊栏目 数字视频
研究方向 页码范围 1-5
页数 5页 分类号 TP391.1
字数 4612字 语种 中文
DOI 10.16280/j.videoe.2019.13.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 艾斯卡尔·艾木都拉 新疆大学信息科学与工程学院 170 561 11.0 15.0
2 李斌 新疆大学信息科学与工程学院 4 21 1.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (10)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
平行语料库
句子对齐
线性回归
翻译语料
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电视技术
月刊
1002-8692
11-2123/TN
大16开
北京市朝阳区酒仙桥北路乙7号(北京743信箱杂志社)
2-354
1977
chi
出版文献量(篇)
12294
总下载数(次)
21
论文1v1指导