基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
命名实体翻译等价对在跨语言信息处理中具有非常重要的应用价值,然而由于语料资源的有限性,国内外关于汉柬命名实体等价对的抽取方法还没有深入研究.论文从可比语料文本出发,根据不同类型实体要素的特点以及在可比语料中的特点,选取了柬文命名实体到中文命名实体的音译特征、翻译特征、可比语料中命名实体的上下文特征及自身的长度特征,提出了一种基于多特征融合来计算相似度的方法来挖掘汉柬双语命名实体等价对.实验表明该方法取得了比较好的效果,其中挖掘人名实体对的准确率达到76%,召回率达到66%,证明了该方法要优于只采用单一特征的方法.
推荐文章
基于位置敏感Embedding的中文命名实体识别
命名实体识别
表示学习
Embedding
多尺度聚类
条件随机场
基于BLSTM-CRF中文领域命名实体识别框架设计
BLSTM-CRF
CBOW
Boson
命名实体识别
基于动态阈值和命名实体的双重过滤话题追踪
动态阈值
命名实体
双重过滤
KL距离
话题追踪
基于条件随机场的网络评论与事件中命名实体匹配研究
条件随机场
命名实体
变体形式
综合相似度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于特征相似度的可比语料挖掘汉柬命名实体等价对
来源期刊 计算机与数字工程 学科 工学
关键词 命名实体等价对 汉柬双语 多特征融合 可比语料 音译模型
年,卷(期) 2017,(5) 所属期刊栏目 系统结构
研究方向 页码范围 882-885,910
页数 5页 分类号 TP391.1
字数 4058字 语种 中文
DOI 10.3969/j.issn.1672-9722.2017.05.020
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 严馨 昆明理工大学信息工程与自动化学院 40 122 5.0 10.0
5 夏青 昆明理工大学信息工程与自动化学院 2 1 1.0 1.0
9 周枫 昆明理工大学信息工程与自动化学院 41 74 5.0 7.0
13 徐璐 昆明理工大学信息工程与自动化学院 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (5)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
命名实体等价对
汉柬双语
多特征融合
可比语料
音译模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与数字工程
月刊
1672-9722
42-1372/TP
大16开
武汉市东湖新技术开发区凤凰产业园藏龙北路1号
1973
chi
出版文献量(篇)
9945
总下载数(次)
28
总被引数(次)
47579
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导