基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了一种基于多因素的文本主题的提取方法,并着重讨论了相应的权值体系.根据概念间的相互关系,对同义概念进行语义归并和上下位概念进行语义聚焦.对于给定的文本,先进行特征词抽取进而生成代表主题概念的重要词汇.综合语句所在位置、语句中的标题、语句中所含重要词汇等多因素构造语句权值表达式,在此基础上,采用主题句选择算法保证每一个主题句被选中,同时解决了主题句的去重问题.实验结果表明,该方法具有较高的抽准率.
推荐文章
基于隐马尔可夫模型的中文文本事件信息抽取
隐马尔可夫模型
事件信息抽取
触发词
事件要素
基于主题概念聚类的中文文本聚类
中文文本聚类
HowNet
主题概念
Chmeleon算法
基于同义词词林的中文文本主题词提取
主题词提取
同义词词林
权值
同义词
基于非负矩阵分解的中文文本主题分类
主题分类
非负矩阵分解
潜在语义索引
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多因素的中文文本主题自动抽取方法
来源期刊 计算机技术与发展 学科 工学
关键词 主题句 主题抽取 文本主题 重要词汇 语句权值
年,卷(期) 2010,(7) 所属期刊栏目 智能、算法、系统工程
研究方向 页码范围 72-75,79
页数 分类号 TP181
字数 4215字 语种 中文
DOI 10.3969/j.issn.1673-629X.2010.07.019
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘金岭 淮阴工学院计算机工程学院 63 355 10.0 15.0
2 谈芸 淮阴工学院计算机工程学院 1 5 1.0 1.0
3 李健普 淮阴工学院计算机工程学院 1 5 1.0 1.0
4 袁娜 淮阴工学院计算机工程学院 1 5 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (31)
共引文献  (127)
参考文献  (9)
节点文献
引证文献  (5)
同被引文献  (14)
二级引证文献  (6)
1957(1)
  • 参考文献(0)
  • 二级参考文献(1)
1958(2)
  • 参考文献(0)
  • 二级参考文献(2)
1969(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(5)
  • 参考文献(1)
  • 二级参考文献(4)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(5)
  • 参考文献(0)
  • 二级参考文献(5)
2001(5)
  • 参考文献(1)
  • 二级参考文献(4)
2002(6)
  • 参考文献(1)
  • 二级参考文献(5)
2003(4)
  • 参考文献(2)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(2)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(3)
  • 引证文献(1)
  • 二级引证文献(2)
2018(3)
  • 引证文献(2)
  • 二级引证文献(1)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
主题句
主题抽取
文本主题
重要词汇
语句权值
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导