基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
中文分词结果对中英命名实体识别及对齐有着直接的影响,本文提出了一种命名实体识别及对齐中的中文分词优化方法。该方法利用实体词汇的对齐信息,首先修正命名实体识别结果,然后根据实体对齐结果调整分词粒度、修正错误分词。分词优化后的结果使得双语命名实体尽可能多地实现一一对应,进而提高中英命名实体翻译抽取和统计机器翻译的效果。实验结果表明了本文优化方法的有效性。
推荐文章
基于众包标注的中文微博命名实体识别
舆论监测
众包标注
EM算法
中文微博
命名实体识别
面向网络文本的中文产品命名实体识别
产品命名实体识别
最大熵模型
产品知识库构建
基于位置敏感Embedding的中文命名实体识别
命名实体识别
表示学习
Embedding
多尺度聚类
条件随机场
基于感知机模型藏文命名实体识别
藏文音节
命名实体
藏文命名实体
感知机模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 中英命名实体识别及对齐中的中文分词优化
来源期刊 电子学报 学科 工学
关键词 分词 命名实体识别 双语对齐 机器翻译
年,卷(期) 2015,(8) 所属期刊栏目 学术论文
研究方向 页码范围 1481-1487
页数 7页 分类号 TP391
字数 7388字 语种 中文
DOI 10.3969/j.issn.0372-2112.2015.08.003
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 戴新宇 南京大学计算机软件新技术国家重点实验室 29 630 12.0 25.0
5 尹存燕 南京大学计算机软件新技术国家重点实验室 15 577 11.0 15.0
9 黄书剑 南京大学计算机软件新技术国家重点实验室 8 88 4.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (16)
共引文献  (200)
参考文献  (7)
节点文献
引证文献  (16)
同被引文献  (35)
二级引证文献  (15)
1974(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(2)
  • 参考文献(1)
  • 二级参考文献(1)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(6)
  • 参考文献(1)
  • 二级参考文献(5)
2007(3)
  • 参考文献(1)
  • 二级参考文献(2)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(4)
  • 引证文献(4)
  • 二级引证文献(0)
2018(10)
  • 引证文献(6)
  • 二级引证文献(4)
2019(11)
  • 引证文献(4)
  • 二级引证文献(7)
2020(4)
  • 引证文献(0)
  • 二级引证文献(4)
研究主题发展历程
节点文献
分词
命名实体识别
双语对齐
机器翻译
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子学报
月刊
0372-2112
11-2087/TN
大16开
北京165信箱
2-891
1962
chi
出版文献量(篇)
11181
总下载数(次)
11
总被引数(次)
206555
论文1v1指导