基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
分词作为自然语言处理(NLP)的第一步,有着不可或缺的作用.中文分词(CWS)由于语言的复杂性成为学者研究热点.根据历年文献资料,分词方法主要包括词典分词、统计分词以及神经网络分词.随着机器学习的发展,神经网络成为分词领域主流算法,基于神经网络的长短时记忆网络和基于统计的条件随机场分词在提高准确度方面作用巨大,准确度达97%.在此之后,分词歧义和未登录词识别得到很大改进,但研究发现改进模型结构带来的准确度波动不大,且增加了模型复杂性,降低了运算速度.卷积神经网络能更好地理解语义信息,利用稀疏连接缩短运算时间、提高效率,成为下一步工作重点.
推荐文章
中文分词算法研究与分析
中文分词
字符串匹配分词
统计分词
理解分词
中文分词词典机制的研究
中文分词
词典机制
带词长整词二分词典
基于云计算的中文分词研究
中文分词
云计算
Hadoop
MapReduce
基于反序词典的中文分词技术研究
中文分词
反序最大匹配
机械分词
反序词典
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 中文分词研究综述
来源期刊 软件导刊 学科
关键词 中文分词 自然语言处理 神经网络 卷积神经网络 跨领域分词 分词速度
年,卷(期) 2021,(4) 所属期刊栏目 研究综述
研究方向 页码范围 247-252
页数 6页 分类号 TP301
字数 语种 中文
DOI 10.11907/rjdk.201673
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (18)
共引文献  (2)
参考文献  (9)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1984(1)
  • 参考文献(1)
  • 二级参考文献(0)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(5)
  • 参考文献(1)
  • 二级参考文献(4)
2014(2)
  • 参考文献(0)
  • 二级参考文献(2)
2015(2)
  • 参考文献(0)
  • 二级参考文献(2)
2017(2)
  • 参考文献(0)
  • 二级参考文献(2)
2018(2)
  • 参考文献(1)
  • 二级参考文献(1)
2019(2)
  • 参考文献(2)
  • 二级参考文献(0)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
中文分词
自然语言处理
神经网络
卷积神经网络
跨领域分词
分词速度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件导刊
月刊
1672-7800
42-1671/TP
16开
湖北省武汉市
38-431
2002
chi
出版文献量(篇)
9809
总下载数(次)
57
总被引数(次)
30383
论文1v1指导