作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对当前基于深度学习模型中文分词算法中存在的语义理解不全和词位信息不足的问题,提出了基于双向长短期记忆(Bi-LSTM)神经网络模型的六词位标注集中文分词方法.首先,利用双向长短期记忆神经网络模型自动发现文本特征;然后,通过六词位标注集从文本深层语义上高效准确完成中文分词任务;最后,通过第二国际汉语分词评测(SIGHAN)提供的Backoff2005语料集进行实验验证,在相同实验条件下,该方法与条件随机场(CRF)方法、单向长短期记忆神经网络方法、双向长短期记忆神经网络四词位方法进行比较,分别可以提高分词准确率3%、4%、1%,从而证明该中文分词方法是合理和有效的.
推荐文章
基于BI_LSTM_CRF神经网络的序列标注中文分词方法
自然语言处理
中文分词
神经网络
双向长短时记忆条件随机场
字嵌入
序列标注
基于LSTM网络的中文地址分词法的设计与实现
中文地址
分词
卡短时记忆
未标记数据集
基于LSTM网络的序列标注中文分词法
中文分词
LSTM
字嵌入
自然语言处理
一种基于双向LSTM的联合学习的中文分词方法
中文分词
大规模语料库
联合学习
双向长短时记忆模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Bi-LSTM-6Tags的智能中文分词方法
来源期刊 计算机应用 学科
关键词 双向LSTM 六词位标注 中文分词
年,卷(期) 2018,(z2) 所属期刊栏目 数据科学与技术
研究方向 页码范围 107-110
页数 4页 分类号
字数 3636字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王玮 3 5 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (56)
共引文献  (214)
参考文献  (9)
节点文献
引证文献  (3)
同被引文献  (4)
二级引证文献  (1)
1972(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(5)
  • 参考文献(1)
  • 二级参考文献(4)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(5)
  • 参考文献(0)
  • 二级参考文献(5)
2007(12)
  • 参考文献(1)
  • 二级参考文献(11)
2009(6)
  • 参考文献(0)
  • 二级参考文献(6)
2010(8)
  • 参考文献(1)
  • 二级参考文献(7)
2011(3)
  • 参考文献(0)
  • 二级参考文献(3)
2012(5)
  • 参考文献(1)
  • 二级参考文献(4)
2014(2)
  • 参考文献(0)
  • 二级参考文献(2)
2015(4)
  • 参考文献(0)
  • 二级参考文献(4)
2016(3)
  • 参考文献(2)
  • 二级参考文献(1)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(4)
  • 引证文献(3)
  • 二级引证文献(1)
研究主题发展历程
节点文献
双向LSTM
六词位标注
中文分词
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
总被引数(次)
209512
论文1v1指导