基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在分析当前多文档自动文摘方法中使用较多的特征基础上,提出了一种特征组合优化模型.该模型选用tf*idf,句子位置及与标题句相似度来判断句子包含信息的重要程度,并加入了句子长度特征解决由tf*idf特征引起的长度偏长的句子占优势的问题,采用这4个特征来判断句子的重要性,并给每个特征指定权重来解决优化问题,实验结果表明特征组合优化模型在多文档自动文摘中的可行性.
推荐文章
多文档自动文摘综述
多文档自动文摘
自然语言处理
情报科学
主题模型LDA的多文档自动文摘
多文档自动
句子分值计算
主题模型
LDA
主题数目
主题信息的中文多文档自动文摘系统
中文自动文摘
浅层狄利赫雷分配(LDA)
主题模型
多文档
基于时间戳的多文档自动文摘
多文档自动文摘
时间戳
信息抽取
句子相似度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 多文档自动文摘中的特征组合优化
来源期刊 计算机系统应用 学科 工学
关键词 tf*idf 句子位置 标题句相似度 句子长度 组合优化
年,卷(期) 2008,(8) 所属期刊栏目 研究开发
研究方向 页码范围 59-63
页数 5页 分类号 TP3
字数 4442字 语种 中文
DOI 10.3969/j.issn.1003-3254.2008.08.015
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张晓龙 武汉科技大学计算机科学与技术学院 49 652 13.0 24.0
2 刘茂福 武汉科技大学计算机科学与技术学院 33 169 9.0 11.0
3 李淑君 武汉科技大学计算机科学与技术学院 1 11 1.0 1.0
4 金可佳 武汉科技大学计算机科学与技术学院 1 11 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (33)
共引文献  (113)
参考文献  (6)
节点文献
引证文献  (11)
同被引文献  (18)
二级引证文献  (76)
1958(3)
  • 参考文献(0)
  • 二级参考文献(3)
1961(1)
  • 参考文献(0)
  • 二级参考文献(1)
1964(1)
  • 参考文献(0)
  • 二级参考文献(1)
1969(1)
  • 参考文献(0)
  • 二级参考文献(1)
1973(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1981(1)
  • 参考文献(0)
  • 二级参考文献(1)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(2)
  • 参考文献(0)
  • 二级参考文献(2)
1990(3)
  • 参考文献(0)
  • 二级参考文献(3)
1991(2)
  • 参考文献(0)
  • 二级参考文献(2)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(3)
  • 参考文献(0)
  • 二级参考文献(3)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(4)
  • 参考文献(0)
  • 二级参考文献(4)
1999(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(2)
  • 参考文献(2)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2008(1)
  • 引证文献(1)
  • 二级引证文献(0)
2009(1)
  • 引证文献(1)
  • 二级引证文献(0)
2010(3)
  • 引证文献(3)
  • 二级引证文献(0)
2011(3)
  • 引证文献(3)
  • 二级引证文献(0)
2012(5)
  • 引证文献(2)
  • 二级引证文献(3)
2013(8)
  • 引证文献(0)
  • 二级引证文献(8)
2014(14)
  • 引证文献(0)
  • 二级引证文献(14)
2015(6)
  • 引证文献(0)
  • 二级引证文献(6)
2016(15)
  • 引证文献(1)
  • 二级引证文献(14)
2017(17)
  • 引证文献(0)
  • 二级引证文献(17)
2018(8)
  • 引证文献(0)
  • 二级引证文献(8)
2019(5)
  • 引证文献(0)
  • 二级引证文献(5)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
tf*idf
句子位置
标题句相似度
句子长度
组合优化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
论文1v1指导