基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
中文分词是作战文书中语义理解的基本任务.在中文分词的研究中,未登录词识别始终是一个难题.论文通过了一种可扩展外部知识的中文分词模型来提高未登录词的召回率.分词模型以基于序列标注的深度网络模型为骨架,使用双路注意力机制融入外部知识.外部知识是词范畴信息,是一种上下文信息,有助于识别未登录词.双路注意力机制使用自注意力机制编码词范畴信息.在构建的语料集上进行实验,试验结果表明,相对于基线方法,论文实现的分词模型能有效提升作战文书中文分词的准确率以及未登录词的召回率.
推荐文章
基于字簇的多模型中文分词方法研究
中文分词
构词规律
模型参数
聚类
基于XML描述的动态可扩展数据报文的模型构建方法
常规数据报文
动态可扩展数据报文
信息单元
XML语言
基于音节标注的藏文自动分词研究
藏文
分词
序列标注
最大熵
条件随机场
最大间隔Markov网络模型
基于二元关系分词模型解决歧义词切分
汉语分词
歧义词切分
二元关系模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于可扩展外部知识的分词模型研究
来源期刊 舰船电子工程 学科 数学
关键词 中文分词 先验知识 注意力机制 深度学习
年,卷(期) 2022,(1) 所属期刊栏目 计算机与网络安全
研究方向 页码范围 99-103,119
页数 6页 分类号 O141.4
字数 语种 中文
DOI 10.3969/j.issn.1672-9730.2022.01.023
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
中文分词
先验知识
注意力机制
深度学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
舰船电子工程
月刊
1672-9730
42-1427/U
大16开
湖北省武汉市
1981
chi
出版文献量(篇)
9053
总下载数(次)
18
总被引数(次)
27655
论文1v1指导