基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对现有基于seq2seq模型在生成摘要时容易出现语义无关的摘要词,同时没有考虑到关键词在摘要生成中的作用,提出一种融合关键词的中文新闻文本摘要生成方法.首先将源文本词依次输入到Bi-LSTM模型中;然后将得到的时间步隐藏状态输入到滑动卷积神经网络,提取每个词与相邻词之间的局部特征;其次利用关键词信息和门控单元对新闻文本信息进行过滤,去除冗余信息;再通过自注意力机制获得每个词的全局特征信息,最终编码得到具有层次性的局部结合全局的词特征表示;将编码得到的词特征表示输入到带有注意力机制的LSTM模型中解码得到摘要信息.该方法通过滑动卷积网络对新闻词的n-g ram特征建模,在此基础上利用自注意力机制,获得具有层次性的局部结合全局的词特征表示.同时,考虑了关键词在新闻摘要生成中的重要作用,利用门控单元去除冗余信息,以获得更精准的新闻文本信息.在搜狗全网新闻语料上的实验表明,该方法能够有效提高摘要生成质量,能够有效地提高ROUGE-1、ROUGE-2、ROUGE-L值.
推荐文章
使用关键词扩展的新闻文本自动摘要方法
关键词扩展
相近文本
自动摘要
图算法
系统实现
中文文本同频词统计规律及在关键词提取中的应用
同频词
齐普夫定律
布茨定律
提取
TF-IDF算法
中文时间关键词识别研究
时间关键词
时间关键词识别
谱聚类
融合句子情感和主题相似性的中文新闻文本情感摘要
情感摘要
句子情感
LexRank
句子特征
主题相似性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 融合关键词的中文新闻文本摘要生成
来源期刊 计算机工程与科学 学科 工学
关键词 文本摘要生成 滑动卷积网络 关键词信息融合 门控单元 全局编码
年,卷(期) 2020,(12) 所属期刊栏目 人工智能与数据挖掘
研究方向 页码范围 2265-2272
页数 8页 分类号 TP391.1
字数 语种 中文
DOI 10.3969/j.issn.1007-130X.2020.12.021
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (26)
共引文献  (20)
参考文献  (9)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(3)
  • 参考文献(0)
  • 二级参考文献(3)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(2)
  • 参考文献(0)
  • 二级参考文献(2)
2016(2)
  • 参考文献(0)
  • 二级参考文献(2)
2017(4)
  • 参考文献(0)
  • 二级参考文献(4)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(5)
  • 参考文献(4)
  • 二级参考文献(1)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本摘要生成
滑动卷积网络
关键词信息融合
门控单元
全局编码
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
总被引数(次)
59030
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导