基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统的中文分词方法是一种基于单词标注的传统机器学习方法,但学习方法需要人工配置和提取中文文本的特征.缺点是同义词库维度较高且CPU训练模型较长.本文针对以上问题进行了研究,构建了内嵌条件随机场的长短时神经网络模型,使用长短时神经网络隐含层的上下文向量作为输出层标注的特征,使用内嵌的条件随机场模型表示标注之间的约束关系采用双向LSTM和CRF相结合的训练方法进行特定领域知识点的中文分词.对中文分词测试常用语料库的实验比较表明,基于BLSTM和CRF网络模型的方法可以获得比传统机器学习方法更好的性能;使用六字标记并添加预训练的字嵌入向量可以实现相对较好的分词性能;BLSTM-CRF网络模型方法更易于推广并应用于其他自然语言处理中的序列标注任务.
推荐文章
基于BLSTM-CRF中文领域命名实体识别框架设计
BLSTM-CRF
CBOW
Boson
命名实体识别
基于E-CNN和BLSTM-CRF的临床文本命名实体识别
命名实体识别
临床文本
集成的卷积神经网络
基于BLSTM-CRF中文领域命名实体识别框架设计
BLSTM-CRF
CBOW
Boson
命名实体识别
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于BLSTM-CRF的领域知识点实体识别技术
来源期刊 软件 学科 工学
关键词 实体识别 神经网络 BLSTM CRF
年,卷(期) 2019,(2) 所属期刊栏目 基金项目论文
研究方向 页码范围 1-5
页数 5页 分类号 TP391.41
字数 4036字 语种 中文
DOI 10.3969/j.issn.1003-6970.2019.02.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 曹春萍 上海理工大学光电信息与计算机工程学院 52 244 8.0 13.0
2 周海华 上海理工大学光电信息与计算机工程学院 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (96)
共引文献  (104)
参考文献  (13)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1958(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(5)
  • 参考文献(0)
  • 二级参考文献(5)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(9)
  • 参考文献(0)
  • 二级参考文献(9)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(8)
  • 参考文献(1)
  • 二级参考文献(7)
2010(9)
  • 参考文献(0)
  • 二级参考文献(9)
2011(13)
  • 参考文献(3)
  • 二级参考文献(10)
2012(6)
  • 参考文献(0)
  • 二级参考文献(6)
2013(7)
  • 参考文献(0)
  • 二级参考文献(7)
2014(8)
  • 参考文献(1)
  • 二级参考文献(7)
2015(2)
  • 参考文献(1)
  • 二级参考文献(1)
2016(6)
  • 参考文献(3)
  • 二级参考文献(3)
2017(4)
  • 参考文献(0)
  • 二级参考文献(4)
2018(4)
  • 参考文献(3)
  • 二级参考文献(1)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(2)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
实体识别
神经网络
BLSTM
CRF
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件
月刊
1003-6970
12-1151/TP
16开
北京市3108信箱
1979
chi
出版文献量(篇)
9374
总下载数(次)
40
相关基金
上海市自然科学基金
英文译名:
官方网址:http://www.lawyee.net/Act/Act_Display.asp?RID=46696
项目类型:面上项目
学科类型:
论文1v1指导