基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
以互联网为代表的信息技术的发展使人们索取信息变得前所未有的便捷,同时也对如何有效利用信息提出了挑战。自动文摘技术通过自动选择文档中的代表句子,可以极大提高信息使用的效率。近年来,基于英文和中文的自动文摘技术获得广泛关注并取得长足进展,而对少数民族语言的自动文摘研究还不够充分,例如维吾尔语。构造了一个面向维吾尔语的自动文摘系统。首先利用维吾尔语的语言学知识对文档进行预处理,之后对文档进行了关键词提取,利用这些关键词进行了抽取式自动文摘。比较了基于TF-IDF和基于TextRank的两种关键词提取算法,证明TextRank方法提取出的关键词更适合自动文摘应用。通过研究证明了在充分考虑到维吾尔语语言信息的前提下,基于关键词的自动文摘方法可以取得让人满意的效果。
推荐文章
基于语义的文档关键词提取方法
语义距离
密度聚类
关键词提取
基于PAT-tree的中文关键词自动检索模式的研究
PAT-tree
信息检索
语言模型
交互信息
基于主题特征的关键词抽取
关键词抽取
主题特征
主题模型
装袋决策树
基于词向量与TextRank的关键词提取方法
抽取
语义差异性
TextRank
词向量
隐含主题分布
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于关键词的维吾尔单文档自动文摘技术研究
来源期刊 计算机工程与应用 学科 工学
关键词 维吾尔文 自动文摘 TF-IDF算法 Textrank ROUGE
年,卷(期) 2015,(16) 所属期刊栏目 数据库、数据挖掘、机器学习
研究方向 页码范围 130-135
页数 6页 分类号 TP311
字数 7178字 语种 中文
DOI 10.3778/j.issn.1002-8331.1308-0372
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 艾斯卡尔·艾木都拉 新疆大学信息科学与工程学院 170 561 11.0 15.0
2 买哈铺热提·外力 新疆大学信息科学与工程学院 1 6 1.0 1.0
3 赵梦原 清华大学语音和语言技术研究中心 1 6 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (7)
参考文献  (10)
节点文献
引证文献  (6)
同被引文献  (10)
二级引证文献  (3)
1958(1)
  • 参考文献(1)
  • 二级参考文献(0)
1971(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(4)
  • 参考文献(4)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(3)
  • 引证文献(3)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(3)
  • 引证文献(1)
  • 二级引证文献(2)
2020(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
维吾尔文
自动文摘
TF-IDF算法
Textrank
ROUGE
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导