基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
俄语是联合国工作语言之一,是俄罗斯等多个国家的官方语言.随着"一带一路"倡议的推进和全球化进程的加快,俄语文本数据成为有关组织管理决策的重要信息来源,俄语文本挖掘也因而成为重要的管理决策支持方法.然而,俄语文本挖掘方法研究目前还远未成熟,尤其是其关键基础——俄语文本词语提取的性能较低,阻碍着俄语文本建模的准确性.因此,文章提出一种多策略融合的俄语文本词语提取方法,结合俄语词性分析、语法规则和串频统计等多种方法,自动提取包含单词和短语在内的俄语词语.在联合国平行语料库和Taiga Corpus语料库上的实验结果表明,文章提出的方法在保证高召回率的同时,达到了85%以上的高准确率,显著优于常用的n-gram方法,能够为俄语文本主题发现和文本分/聚类等文本挖掘应用提供有效的词库.
推荐文章
论科技俄语翻译中词语的增减
科技俄语
翻译
增词
减词
多类型分类器融合的文本分类方法研究
文本分类
分类器融合
主成分分析
潜在语义索引
小学语文词语教学策略研究
小学语文
词语教学
兴趣
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 多策略融合的俄语文本词语提取方法研究
来源期刊 中国科技术语 学科
关键词 俄语文本挖掘 词语提取 词性标注 频繁词串
年,卷(期) 2021,(3) 所属期刊栏目
研究方向 页码范围 59-67
页数 9页 分类号 G623.35|H08
字数 语种 中文
DOI 10.12339/j.issn.1673-8578.2021.03.009
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (54)
共引文献  (19)
参考文献  (11)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1945(1)
  • 参考文献(1)
  • 二级参考文献(0)
1957(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(7)
  • 参考文献(0)
  • 二级参考文献(7)
2007(6)
  • 参考文献(0)
  • 二级参考文献(6)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(3)
  • 参考文献(1)
  • 二级参考文献(2)
2010(2)
  • 参考文献(1)
  • 二级参考文献(1)
2011(7)
  • 参考文献(1)
  • 二级参考文献(6)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(4)
  • 参考文献(0)
  • 二级参考文献(4)
2015(4)
  • 参考文献(1)
  • 二级参考文献(3)
2016(4)
  • 参考文献(0)
  • 二级参考文献(4)
2017(3)
  • 参考文献(0)
  • 二级参考文献(3)
2018(2)
  • 参考文献(1)
  • 二级参考文献(1)
2019(2)
  • 参考文献(2)
  • 二级参考文献(0)
2020(2)
  • 参考文献(2)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
俄语文本挖掘
词语提取
词性标注
频繁词串
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国科技术语
双月刊
1673-8578
11-5554/N
大16开
北京东皇城根北街16号
2-947
1985
chi
出版文献量(篇)
2413
总下载数(次)
9
论文1v1指导