基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
双语词典是跨语言检索以及机器翻译等自然语言处理应用的基础资源.本文提出了一种从非平行语料中抽取特定领域双语词典的算法.首先给出了算法的基本假设并回顾了相关的研究方法,然后详细给出了利用词间关系矩阵法从特定领域非平行语料中抽取双语词典的过程,最后通过大量实验分析了种子词选择对词典抽取结果的影响,实验结果表明种子词的数量和频率对词典抽取结果有积极作用.
推荐文章
基于领域模型的Web数据抽取与集成
Web数据模型
Web数据模式
领域数据模型
数据抽取与集成
基于词向量与可比语料库的双语词典提取研究
双语词典
词向量
词间关系
可比语料库
基于双语词典的汉英词语对齐算法研究
词语对齐
对齐窗口
人读双语词典
机读双语词典
基于Web Services数据抽取的研究与实践
Web Services
并行数据抽取
增量数据
服务安全
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Web数据的特定领域双语词典抽取
来源期刊 中文信息学报 学科 工学
关键词 计算机应用 中文信息处理 双语词典 词间关系矩阵 非平行语料 种子词
年,卷(期) 2006,(2) 所属期刊栏目
研究方向 页码范围 16-23
页数 8页 分类号 TP391.2
字数 5571字 语种 中文
DOI 10.3969/j.issn.1003-0077.2006.02.003
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 西野文人 3 71 2.0 3.0
2 于浩 7 335 5.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (29)
参考文献  (5)
节点文献
引证文献  (26)
同被引文献  (13)
二级引证文献  (33)
2000(3)
  • 参考文献(2)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(3)
  • 参考文献(2)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2007(1)
  • 引证文献(1)
  • 二级引证文献(0)
2008(4)
  • 引证文献(4)
  • 二级引证文献(0)
2009(4)
  • 引证文献(3)
  • 二级引证文献(1)
2010(6)
  • 引证文献(2)
  • 二级引证文献(4)
2011(8)
  • 引证文献(3)
  • 二级引证文献(5)
2012(9)
  • 引证文献(5)
  • 二级引证文献(4)
2013(6)
  • 引证文献(3)
  • 二级引证文献(3)
2014(5)
  • 引证文献(1)
  • 二级引证文献(4)
2015(3)
  • 引证文献(1)
  • 二级引证文献(2)
2016(8)
  • 引证文献(1)
  • 二级引证文献(7)
2017(2)
  • 引证文献(1)
  • 二级引证文献(1)
2018(2)
  • 引证文献(0)
  • 二级引证文献(2)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
计算机应用
中文信息处理
双语词典
词间关系矩阵
非平行语料
种子词
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
论文1v1指导