基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
中文分词(Chinese Word Segmentation,CWS)是自然语言处理(Natural Language Processing,NLP)中一项重要的基础任务.由于不同领域中文词汇的特殊性以及缺乏相关领域的标记数据,面向特定领域的分词任务是近年来中文分词研究面临的挑战之一.因此,提出了一种基于双向长短时记忆网络(Bidirectional Long Short-Term Memory,Bi-LSTM)的分词模型,其中分别使用了大规模的中文通用语料以及少量中文医学语料训练模型来构建这种全新的分词模型.该模型在仅使用少量中文医学领域标记数据的情况下,在该领域的分词任务上获得了较好的分词效果,实验结果中的最优F1值为95.54%,相比单独使用中文医学语料训练的分词模型,有比较明显的提升.
推荐文章
基于Bi-LSTM的生物医学文本语义消歧研究
语义消歧
Bi-LSTM
无监督学习
生物医学
上下文表示
基于Bi-LSTM的无人机轨迹预测模型及仿真
无人机
轨迹预测
Bi-LSTM
循环神经网络
自主防撞
时间序列
结合Bi-LSTM与VDCNN的社交网络攻击性言论识别方法
攻击性言论识别
文本分类
卷积神经网络
深度残差网络
基于BI_LSTM_CRF神经网络的序列标注中文分词方法
自然语言处理
中文分词
神经网络
双向长短时记忆条件随机场
字嵌入
序列标注
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Bi-LSTM的医学文本分词模型
来源期刊 通信技术 学科 工学
关键词 中文分词 自然语言处理 双向长短期记忆网络 领域分词
年,卷(期) 2022,(2) 所属期刊栏目 信息处理与传输|Information Processing & Transmission
研究方向 页码范围 151-159
页数 9页 分类号 TP391.1
字数 语种 中文
DOI 10.3969/j.issn.1002-0802.2022.02.003
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
中文分词
自然语言处理
双向长短期记忆网络
领域分词
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
通信技术
月刊
1002-0802
51-1167/TN
大16开
四川省成都高新区永丰立交桥(南)创业路8号
62-153
1967
chi
出版文献量(篇)
10805
总下载数(次)
35
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导