基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着计算机技术的迅猛发展,知识变成人工智能领域中的一个重要资源.在面向自由文本的自动知识抽取中,名词短语识别是基础的任务之一,尤其是含动词的名词短语.已有的名词短语识别研究更多地着眼于命名实体的识别,范围较窄且不能解决其他含动词的名词短语,加之含动词名词短语识别存在分词错误、边界确定、特殊结构、标记数据少等难点,含动词名词短语识别目前仍然是一个巨大的挑战.基于此,文章提出了一种神经网络与规则、统计相结合的方法.首先对语句进行预处理,其中包含包括词性、助词、时间、数量词等内容的修正和合并;然后,使用双向LSTM与条件随机场融合的方法对含动词命名实体进行识别;接着使用百度词条、固定搭配、语义分类和描述框架文法的方式对含动词名词短语识别;最后使用随机抽取的多动词文本进行实验和分析,实验结果表明,本文方法达到89%的准确率.
推荐文章
基于规则的哈萨克语基本名词短语识别研究
语料库
基本名词短语
哈萨克语
短语结构
规则
基于辅助短语标记的名词短语识别
辅助短语标记
名词短语
映射公式
基于混合统计模型的中文基本名词短语识别
基本名词短语
支持向量机模型
特征模板
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于混合方法的含动词名词短语识别研究
来源期刊 山西大学学报(自然科学版) 学科 物理学
关键词 含动词名词短语识别 命名实体识别 语义分类和描述框架文法
年,卷(期) 2019,(1) 所属期刊栏目 第二十四届全国信息检索学术会议(CCIR 2018)论文选登
研究方向 页码范围 31-40
页数 10页 分类号 O436
字数 8470字 语种 中文
DOI 10.13451/j.cnki.shanxi.univ(nat.sci.).2018.11.05.004
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 曹存根 中国科学院计算技术研究所智能信息处理重点实验室 91 991 17.0 27.0
2 王石 中国科学院计算技术研究所智能信息处理重点实验室 23 178 7.0 12.0
3 方芳 中国科学院计算技术研究所智能信息处理重点实验室 28 197 7.0 13.0
7 符建辉 中国科学院计算技术研究所智能信息处理重点实验室 10 74 5.0 8.0
8 王亚 中国科学院计算技术研究所智能信息处理重点实验室 14 64 4.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (163)
参考文献  (9)
节点文献
引证文献  (1)
同被引文献  (10)
二级引证文献  (0)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(3)
  • 参考文献(2)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
含动词名词短语识别
命名实体识别
语义分类和描述框架文法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
山西大学学报(自然科学版)
季刊
0253-2395
14-1105/N
大16开
太原市坞城路92号
22-42
1960
chi
出版文献量(篇)
2646
总下载数(次)
7
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导