基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统的基于长度的汉英双语句子对齐算法大都以字节作为汉英句子长度的计算单位.提出了几种不同的汉英句子长度计算方法,分别以句子所含动词、名词、形容词、实词、字节及所含全部词语个数作为句子的长度,进行基于长度的汉荚句子对齐.实验结果表明,汉英句子对齐以词语作为句子长度计算单位时,正确率为99.01%,召回率为99.5%.
推荐文章
基于多种长度单位的汉英句子分组对齐算法
自然语言处理
双语语料
句子对齐
分组对齐
句子长度
基于互译特征词对匹配的老-汉双语句子相似度计算方法研究
老-汉双语词典
相似度计算
算法改进
双语句对识别
词汇互译
实验验证
汉英时文翻译中句子连接手段的分类及应用
连接手段
时文翻译
句法结构
实现步骤
小型空调装置毛细管长度计算方法研究
毛细管长度
单相流区
两相流区
计算机模拟
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 汉英句子对齐长度计算方法的研究
来源期刊 计算机工程与设计 学科 工学
关键词 自然语言处理 双语语料库 句子对齐 基于长度的方法 基于词汇的方法
年,卷(期) 2009,(18) 所属期刊栏目 开发与应用
研究方向 页码范围 4356-4358,封3
页数 4页 分类号 TP391
字数 2603字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 昝红英 郑州大学信息工程学院 58 759 11.0 26.0
2 张恩展 仰恩大学计算机与信息学院 2 10 1.0 2.0
3 张霞 仰恩大学计算机与信息学院 3 12 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (34)
参考文献  (4)
节点文献
引证文献  (10)
同被引文献  (10)
二级引证文献  (2)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(2)
  • 引证文献(1)
  • 二级引证文献(1)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(3)
  • 引证文献(3)
  • 二级引证文献(0)
研究主题发展历程
节点文献
自然语言处理
双语语料库
句子对齐
基于长度的方法
基于词汇的方法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与设计
月刊
1000-7024
11-1775/TP
大16开
北京142信箱37分箱
82-425
1980
chi
出版文献量(篇)
18818
总下载数(次)
45
总被引数(次)
161677
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导