基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对目前已有的分词算法和程序在处理海量网络文本分词时性能下降的问题,本文提出了一种基于深度神经网络模型的中文分词方案.该方案利用基于长短期记忆网络的编码-解码模型对数据模型进行训练,并采用得到的模型进行分词.为了提升分词性能,进一步提出了一种基于词向量的修正方法,对采用上述模型的分词结果进行修正.对典型微博语料数据集的实验结果表明,提出基于模型的分词性能相对于传统的分词软件的分词性能有了较大提升.采用提出的词向量修正方法修正后的分词准确率和F值略优于未修正的分词准确率和F值,从而验证了论文提出的分词方案的有效性.
推荐文章
基于深度神经网络的中文新闻文本分类方法
深度神经网络
文本分类
中文新闻
自然语言处理
基于LSTM网络的序列标注中文分词法
中文分词
LSTM
字嵌入
自然语言处理
基于BI_LSTM_CRF神经网络的序列标注中文分词方法
自然语言处理
中文分词
神经网络
双向长短时记忆条件随机场
字嵌入
序列标注
基于门循环单元神经网络的中文分词法
自然语言处理
中文分词
门循环单元
字嵌入
循环神经网络
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于深度神经网络模型的中文分词方案
来源期刊 哈尔滨工程大学学报 学科 工学
关键词 中文分词 长短期记忆网络 编码-解码模型 词向量 准确率 F值
年,卷(期) 2019,(9) 所属期刊栏目
研究方向 页码范围 1662-1666
页数 5页 分类号 TN911.22
字数 3814字 语种 中文
DOI 10.11990/jheu.201812073
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 忻展红 北京邮电大学经济管理学院 81 467 11.0 17.0
2 张雪芬 北京联合大学智慧城市学院 4 9 2.0 3.0
3 许峰 北京邮电大学经济管理学院 2 9 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (12)
共引文献  (183)
参考文献  (7)
节点文献
引证文献  (7)
同被引文献  (17)
二级引证文献  (0)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(6)
  • 参考文献(2)
  • 二级参考文献(4)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(3)
  • 参考文献(1)
  • 二级参考文献(2)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(3)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(3)
  • 二级引证文献(0)
2019(3)
  • 引证文献(3)
  • 二级引证文献(0)
2020(4)
  • 引证文献(4)
  • 二级引证文献(0)
研究主题发展历程
节点文献
中文分词
长短期记忆网络
编码-解码模型
词向量
准确率
F值
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
哈尔滨工程大学学报
月刊
1006-7043
23-1390/U
大16开
哈尔滨市南岗区南通大街145号1号楼
14-111
1980
chi
出版文献量(篇)
5623
总下载数(次)
16
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导