基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了探讨蒙古文自动词切分及词性标注的问题,可以首先对20万词级蒙古文语料的词切分和词性标注情况进行统计和分析,并对其切分和标注错误进行二次修正,然后再采用条件随机场模型(CRF),进行自动“分词”、“词性标注”、分词及词性标注“统一实现”的研究.开放测试的结果表明,蒙古文自动分词准确率在98%以上,蒙古文分词和词性标注“统一实现”实验结果的准确率比分词和词性标注“两步走”实验结果的准确率高出3.55%,“统一实现”实验在考虑“上下文”和特征“连写的附加成分”后所得准确率可以达到93.38%,这在一定程度上解决了蒙古文分词及词性标注问题.
推荐文章
基于CRF的蒙古文人名自动识别研究
蒙古文人名
识别
条件随机场
特征
蒙古文字母到音素转换方法的研究
蒙古文
字母到音素的转换
联合序列模型
联合多元
联合分割
蒙古文少儿图书出版现状及发展对策研究
民族地区
蒙古文少儿图书
出版现状
儿童本位
融合主题与语言模型的蒙古文信息检索方法研究
蒙古文
语言模型
主题模型
Gibbs采样
信息检索
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于CRF模型的蒙古文分词及词性标注的研究
来源期刊 内蒙古大学学报(哲学社会科学版) 学科 工学
关键词 蒙古文分词 蒙古文词性标注 条件随机场
年,卷(期) 2016,(2) 所属期刊栏目 蒙古学研究
研究方向 页码范围 23-28
页数 6页 分类号 TP391
字数 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
蒙古文分词
蒙古文词性标注
条件随机场
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
内蒙古大学学报(哲学社会科学版)
双月刊
1000-5218
15-1051/C
大16开
内蒙古自治区呼和浩特市
16-66
1959
chi
出版文献量(篇)
2637
总下载数(次)
7
总被引数(次)
12694
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导