基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
自然语言处理任务中词处理是基础性的工作,其结果直接影响后续任务的效果.词干和构形附加成分是哈萨克语单词的组成成分,其中词干显示单词的主要意义,而构形附加成分中包含着词法和句法信息,因此词干切分是对哈萨克语进行有效处理的基础.文中构建了哈萨克语词干切分语料库,并通过将哈萨克语词干切分看作是序列化标注问题,提出一种有效的哈萨克语词标注方法,并基于最大熵模型和条件随机场模型构建了对比词干切分实验.结果表明基于条件随机场模型的词干切分准确率比现有最好的哈萨克语词干切分系统的准确率有15%的提高.该方法对哈萨克语词干切分相较于基于规则的方法有了一定的提升.
推荐文章
字符序列标注的维吾尔语词干提取方法
词干提取
序列标注
条件随机场
特征提取
模型训练
预测结果
基于混合方法的维吾尔语词干提取方法研究
维吾尔语
形态变化
词干
词缀
规则方法
词典方法
混合方法
Lovin算法
基于概率轨迹匹配的机器人模仿学习方法
模仿学习
概率模型
轨迹匹配
高斯过程
控制策略
基于语料的哈萨克语词频统计研究
哈萨克语词频统计
幂率定律
齐普夫
频率
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于机器学习方法的哈萨克语词干切分研究
来源期刊 计算机技术与发展 学科 工学
关键词 词干切分 统计学习模型 最大熵模型 条件随机场模型
年,卷(期) 2020,(4) 所属期刊栏目 应用开发研究
研究方向 页码范围 182-188
页数 7页 分类号 TP391
字数 8972字 语种 中文
DOI 10.3969/j.issn.1673-629X.2020.04.035
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 库瓦特拜克·马木提 伊犁师范大学电子与信息工程学院 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (73)
共引文献  (84)
参考文献  (14)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1980(2)
  • 参考文献(0)
  • 二级参考文献(2)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(4)
  • 参考文献(0)
  • 二级参考文献(4)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(7)
  • 参考文献(0)
  • 二级参考文献(7)
2004(10)
  • 参考文献(1)
  • 二级参考文献(9)
2005(8)
  • 参考文献(0)
  • 二级参考文献(8)
2006(7)
  • 参考文献(0)
  • 二级参考文献(7)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(11)
  • 参考文献(3)
  • 二级参考文献(8)
2009(13)
  • 参考文献(2)
  • 二级参考文献(11)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(6)
  • 参考文献(4)
  • 二级参考文献(2)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(3)
  • 参考文献(3)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
词干切分
统计学习模型
最大熵模型
条件随机场模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导