基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
Chinese word segmentation plays an important role in search engine,artificial intelligence,machine translation and so on.There are currently three main word segmentation algorithms:dictionary-based word segmentation algorithms,statistics-based word segmentation algorithms,and understandingbased word segmentation algorithms.However,few people combine these three methods or two of them.Therefore,a Chinese word segmentation model is proposed based on a combination of statistical word segmentation algorithm and understanding-based word segmentation algorithm.It combines Hidden Markov Model(HMM)word segmentation and Bi-LSTM word segmentation to improve accuracy.The main method is to make lexical statistics on the results of the two participles,and to choose the best results based on the statistical results,and then to combine them into the final word segmentation results.This combined word segmentation model is applied to perform experiments on the MSRA corpus provided by Bakeoff.Experiments show that the accuracy of word segmentation results is 12.52%higher than that of traditional HMM model and 0.19%higher than that of BI-LSTM model.
推荐文章
基于Bi-LSTM的维吾尔语人称代词指代消解
指代消解
双向长短时记忆网络
词向量
深度学习
维吾尔语
自然语言处理
基于Bi-LSTM算法的非侵入式负荷监测模型
非侵入式负荷监测
双向长短期记忆网络
特征提取
负荷辨识
基于word2vec和LSTM的饮食健康文本分类研究
文本分类
word2vec
词向量
长短期记忆网络
K-means++
基于CRF和BI-LSTM的命名实体识别方法
命名实体识别
条件随机场
BI-LSTM
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Construction of Word Segmentation Model Based on HMM+BI-LSTM
来源期刊 国际计算机前沿大会会议论文集 学科 工学
关键词 Chinese word segmentation HMM BI-LSTM Sequence tagging
年,卷(期) 2020,(2) 所属期刊栏目
研究方向 页码范围 47-61
页数 15页 分类号 TP3
字数 语种
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Chinese
word
segmentation
HMM
BI-LSTM
Sequence
tagging
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
国际计算机前沿大会会议论文集
半年刊
北京市海淀区西三旗昌临801号
出版文献量(篇)
616
总下载数(次)
6
总被引数(次)
0
论文1v1指导