基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
新闻作为网络信息传播的重要载体,其本质是一个以接近真相为目标的持续过程.随着时间的推进,针对同一新闻事件会出现大量详尽程度不同的网页.如何在这些网页中快速、准确地抽取出这一系列新闻的关键信息成了一个越来越重要的课题.关键词作为对文章内容的简要概括,可以使用户快速了解新闻事件,从而节省大量的时间,因此关键词抽取技术被认为是解决此类问题的关键.文章通过分析新闻网页的特点,提出一种新的基于超图模型的多文档关键词抽取方法,该方法以词作为节点,新闻网页作为超边,并结合网页信任度、新闻发布时间因素,建立了多新闻文档的超图模型,最后使用超图排序算法抽取出关键词.实验的结果验证了该方法的准确性.
推荐文章
基于主题特征的关键词抽取
关键词抽取
主题特征
主题模型
装袋决策树
基于语义的文档关键词提取方法
语义距离
密度聚类
关键词提取
关键词抽取策略研究
关键词抽取
词频
间距
词性
重要度
基于综合权重的多文档关键词抽取算法
多文档
关键词
抽取
综合权重
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于超图的多文档新闻关键词抽取
来源期刊 计算机与数字工程 学科 工学
关键词 多文档超图模型 超图排序 随机游走 关键词抽取 网页信任度 时间因素
年,卷(期) 2017,(12) 所属期刊栏目 信息处理与网络安全
研究方向 页码范围 2474-2478
页数 5页 分类号 TP391
字数 4387字 语种 中文
DOI 10.3969/j.issn.1672-9722.2017.12.031
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 赖华 昆明理工大学信息处理重点实验室 33 108 6.0 9.0
2 范泽泉 昆明理工大学信息工程与自动化学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (14)
共引文献  (98)
参考文献  (9)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1988(2)
  • 参考文献(1)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(3)
  • 参考文献(3)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
多文档超图模型
超图排序
随机游走
关键词抽取
网页信任度
时间因素
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与数字工程
月刊
1672-9722
42-1372/TP
大16开
武汉市东湖新技术开发区凤凰产业园藏龙北路1号
1973
chi
出版文献量(篇)
9945
总下载数(次)
28
总被引数(次)
47579
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导