基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
根据领域性较强的网站往往蕴含大量平行或可比较双语样本这一特点,针对特定领域双语网站的自动识别问题,提出了一种基于全局搜索和局部分类的方法.以电子器件领域为目标,采用全局搜索方法获得该领域双语网站18 944个,随机抽取其中3 000个网站进行人工标注,在标注语料上,采用局部分类方法识别该领域双语网站的性能(F值)达到85.19%.在此基础上,利用识别出的目标领域双语网站中的双语句对,扩充特定领域机器翻译系统的训练集进行实验.实验结果表明,相同测试集下,特定领域机器翻译系统的性能获得显著提升,验证了本文所提出的自动识别特定领域双语网站方法的有效性.
推荐文章
结合主成分分析和局部导数模式的人脸识别方法
人脸识别
局部导数模式
主成分分析法
相似度计算
基于全局和局部颜色特征的图像检索方法
图像检索
颜色均值
子块划分
方向性
融合局部与全局特征提取的虹膜识别方法
虹膜识别
旋转不变性
非张量积小波
尺度不变特征变换方法
融合全局和局部特征的图像特征提取方法
特征提取
线性判别分析
保局投影算法
全局特征
局部特征
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于全局搜索和局部分类的特定领域双语网站识别方法
来源期刊 山西大学学报(自然科学版) 学科 工学
关键词 统计机器翻译 特定领域机器翻译 双语网站 翻译等价对
年,卷(期) 2015,(2) 所属期刊栏目 第二十届全国信息检索学术会议(CCIR 2014)论文选登
研究方向 页码范围 206-214
页数 分类号 TP391
字数 9217字 语种 中文
DOI 10.13451/j.cnki.shanxi.univ(nat.sci.).2015.02.004
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 朱巧明 苏州大学计算机科学与技术学院 261 2058 25.0 31.0
2 洪宇 苏州大学计算机科学与技术学院 66 270 8.0 13.0
3 姚建民 苏州大学计算机科学与技术学院 70 494 10.0 19.0
4 刘昊 苏州大学计算机科学与技术学院 18 51 4.0 6.0
5 王星 苏州大学计算机科学与技术学院 4 16 2.0 4.0
6 刘乐 苏州大学计算机科学与技术学院 4 8 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (10)
参考文献  (6)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(4)
  • 参考文献(2)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
统计机器翻译
特定领域机器翻译
双语网站
翻译等价对
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
山西大学学报(自然科学版)
季刊
0253-2395
14-1105/N
大16开
太原市坞城路92号
22-42
1960
chi
出版文献量(篇)
2646
总下载数(次)
7
总被引数(次)
12039
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导