基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在中文信息处理中,分词是一个十分常见且关键的任务.很多中文自然语言处理的任务都需要先进行分词,再根据分割后的单词完成后续任务.近来,越来越多的中文分词采用机器学习和深度学习方法.然而,大多数模型都不同程度的有模型过于复杂、过于依赖人工处理特征、对未登录词表现欠佳等缺陷.提出一种基于卷积神经网络(Convolutional Neural Networks,CNN)的中文分词模型——PCNN(Pure CNN)模型,该模型使用基于字向量上下文窗口的方式对字进行标签分类,具有结构简单、不依赖人工处理、稳定性好、准确率高等优点.考虑到分布式字向量本身的特性,在PCNN模型中不需要卷积的池化(Pooling)操作,卷积层提取的数据特征得到保留,模型训练速度获得较大提升.实验结果表明,在公开的数据集上,模型的准确率达到当前主流神经网络模型的表现水准,同时在对比实验中也验证了无池化层(Pooling Layer)的网络模型要优于有池化层的网络模型.
推荐文章
基于多尺度池化卷积神经网络的疲劳检测方法研究
视觉特征分析
多尺度池化
卷积神经网络
疲劳检测
人脸检测
嵌套池化三元组卷积神经网络的行人再识别
行人再识别
嵌套池化
三元组损失函数
局部特征
间接度量
基于卷积神经网络的图像隐写分析方法
图像隐写分析
卷积神经网络
批量正规化
激活函数
基于BI_LSTM_CRF神经网络的序列标注中文分词方法
自然语言处理
中文分词
神经网络
双向长短时记忆条件随机场
字嵌入
序列标注
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 无池化层卷积神经网络的中文分词方法
来源期刊 计算机工程与应用 学科 工学
关键词 自然语言处理 中文分词 卷积神经网络 字向量
年,卷(期) 2020,(2) 所属期刊栏目 模式识别与人工智能
研究方向 页码范围 120-126
页数 7页 分类号 TP391
字数 6006字 语种 中文
DOI 10.3778/j.issn.1002-8331.1809-0177
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 袁贞明 杭州师范大学信息工程学院 32 244 8.0 15.0
3 涂文博 杭州师范大学信息工程学院 2 2 1.0 1.0
9 俞凯 杭州师范大学信息工程学院 14 26 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (8)
共引文献  (181)
参考文献  (4)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
自然语言处理
中文分词
卷积神经网络
字向量
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
相关基金
浙江省自然科学基金
英文译名:
官方网址:http://www.zjnsf.net/
项目类型:一般项目
学科类型:
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导