基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对统计模型受限于标注语料规模且不能捕获标注序列的上下文信息问题,提出一种融合深度学习和统计学习的印地语词性标注模型.该模型具有3层逻辑结构,首先在词表示层采用深度神经网络框架训练出印地语单词的形态特征,并利用word2vec方法对语料训练生成具有语义信息的低维度稠密实数词向量,然后在序列表示层将形态特征和词向量作为深度神经网络模型的输入并进行训练,得到输入序列的信息特征,最后在CRF推理层利用深度神经网络模型的输出状态和当前的转移概率矩阵作为CRF模型的参数,最终得到最优的标签序列.对提出的方法与其他方法进行了对比实验,结果表明融合深度学习和统计模型的方法较其他几种统计模型的性能有显著的提升.
推荐文章
基于强化学习的壮语词性标注
智能信息处理
词性标注
强化学习
长短期记忆网络
策略网络
汉语词性自动标注系统的设计与实现
词性自动标注系统
词表
语料库
粗糙集
搭配模式集
统计模型
基于N元模型的维吾尔语词性标注实验研究
词性标注
N元模型
维吾尔语词性标注
神经网络的统计学习理论基础
神经网络
学习过程
经验风险
结构风险
支持向量机
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 融合深度神经网络与统计学习的印地语词性标注方法研究
来源期刊 湖南工业大学学报 学科 工学
关键词 印地语 词性标注 深度神经网络 统计学习 条件随机场
年,卷(期) 2020,(3) 所属期刊栏目 非通用语种智能处理研究
研究方向 页码范围 17-22
页数 6页 分类号 TP391.1
字数 4403字 语种 中文
DOI 10.3969/j.issn.1673-9833.2020.03.003
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李霞 广东外语外贸大学广州市非通用语种智能处理重点实验室 41 308 10.0 15.0
2 王连喜 广东外语外贸大学广州市非通用语种智能处理重点实验室 16 233 7.0 15.0
6 邓致妍 广东外语外贸大学广州市非通用语种智能处理重点实验室 3 0 0.0 0.0
10 钟准 广东外语外贸大学信息科学与技术学院 1 0 0.0 0.0
11 丁曾强 广东外语外贸大学信息科学与技术学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (8)
共引文献  (0)
参考文献  (4)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(3)
  • 参考文献(0)
  • 二级参考文献(3)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
印地语
词性标注
深度神经网络
统计学习
条件随机场
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
湖南工业大学学报
双月刊
1673-9833
43-1468/T
大16开
湖南省株洲市天元区泰山路88号
1987
chi
出版文献量(篇)
3955
总下载数(次)
6
总被引数(次)
15502
论文1v1指导