基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文提出一种基于聚类的自动摘要方法,该方法将文章中所有句子转换为句子向量,并且使用基于AGNES的算法对删除离群点后的句子向量进行聚类,形成多个句子向量个数不超过设定阈值的簇,删除句子向量个数极少的“无用”簇后,从每个簇中挑选出最能代表簇的语义的一个或者两个句子,根据每个句子到语义中心的距离等信息从小到大确定指定数量的几个句子作为关键句,拼接成文章摘要.通过在中国科普博览网站上随机挑选的500篇科普文章上进行实验,上述方法各项指标均优于基于图模型的TextRank算法以及基于统计的方法,证明了该方法的有效性和可用性.
推荐文章
一种基于K-L变换和聚类的视频摘要方法
视频摘要
关键帧
K-L变换
聚类
视频检索
一种基于模糊聚类的故障诊断方法
信息融合
故障诊断
模糊聚类
自组织特征映射
一种基于聚类-遗传算法的文摘提取方法研究
空间向量模型
聚类技术
遗传算法
文本摘要
一种自动确定类个数的谱聚类算法
谱聚类
亲合矩阵
特征值
谱分解
类个数
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于聚类的文章自动摘要方法及实现
来源期刊 科研信息化技术与应用 学科
关键词 自动摘要 聚类 AGNES 簇的语义
年,卷(期) 2019,(1) 所属期刊栏目 技术
研究方向 页码范围 12-19
页数 8页 分类号
字数 7159字 语种 中文
DOI 10.11871/j.issn.1674-9480.2019.01.002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 何洪波 中国科学院计算机网络信息中心 11 32 3.0 5.0
2 王闰强 中国科学院计算机网络信息中心 10 8 2.0 2.0
3 唐建权 中国科学院计算机网络信息中心 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1958(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
自动摘要
聚类
AGNES
簇的语义
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
科研信息化技术与应用
双月刊
1674-9480
11-5943/TP
北京市海淀区中关村南四街4号
chi
出版文献量(篇)
501
总下载数(次)
5
总被引数(次)
1249
论文1v1指导