基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
命名实体识别是自然语言处理领域的一个重要任务,为许多上层应用提供支持。本文主要研究汉语开放域命名实体边界的识别。由于目前该任务尚缺乏训练语料,而人工标注语料的代价又太大,本文首先基于双语平行语料和英语句法分析器自动标注了一个汉语专有名词语料,另外基于汉语依存树库生成了一个名词复合短语语料,然后使用自学习方法将这两部分语料融合形成命名实体边界识别语料,同时训练边界识别模型。实验结果表明自学习的方法可以提高边界识别的准确率和召回率。
推荐文章
基于条件随机场的汉语命名实体识别
可视化工作室2008
条件随机场
汉语分词
命名实体识别
BioTrHMM:基于迁移学习的生物医学命名实体识别算法
迁移学习
隐马尔可夫模型
命名实体识别
文本挖掘
基于位置敏感Embedding的中文命名实体识别
命名实体识别
表示学习
Embedding
多尺度聚类
条件随机场
主动学习与自学习的中文命名实体识别
主动学习
自学习
条件随机场
命名实体识别
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于自学习的汉语开放域命名实体边界识别
来源期刊 智能计算机与应用 学科 工学
关键词 开放域命名实体识别 自学习 训练语料融合
年,卷(期) 2014,(4) 所属期刊栏目
研究方向 页码范围 1-4,8
页数 5页 分类号 TP391.12
字数 4788字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘挺 哈尔滨工业大学计算机科学与技术学院 142 4348 34.0 63.0
2 秦兵 哈尔滨工业大学计算机科学与技术学院 50 1591 16.0 39.0
3 付瑞吉 哈尔滨工业大学计算机科学与技术学院 2 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (27)
参考文献  (1)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1978(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
开放域命名实体识别
自学习
训练语料融合
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
智能计算机与应用
双月刊
2095-2163
23-1573/TN
大16开
哈尔滨市南岗区繁荣街155号(哈工大新技术楼916室)
14-144
1985
chi
出版文献量(篇)
6183
总下载数(次)
26
总被引数(次)
14240
论文1v1指导