基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
关键短语生成是一个能从长文档或者文献中捕获中心思想的实用任务.先前的神经关键短语生成方法基本只注重词级别的信息而忽略文档结构.该文提出了一个句级选择网络(sentence selective network,SenSeNet)用于关键短语生成.该模型重点关注文档的句子结构信息,通过学习句子隐式表示来判断其是否有可能生成关键短语,然后根据判断结果引入对应归纳偏置来辅助解码器生成关键短语.该文使用直通估计量(straight-through estimator)来端到端地训练模型.为了提高句级选择网络性能,该文还提出了一个任务强相关的弱监督信息.实验表明,模型成功地捕获了文档信息,并合理选择了相对较重要的句子,而且模型也更倾向于从这些重要句子中生成关键短语.该文将模型引入到绝大多数序列到序列模型中,在五个数据集中的两个评价指标下,均有显著的性能提升.
推荐文章
基于TF*PDF的热点关键短语提取
TF*PDF
TDT
提取
脉冲值
关键词短语
基于加权复杂网络的中文文档关键短语抽取
关键短语抽取
加权复杂网络
网络分离
加权点度中心度
边界节点
介数
汉语句子联想生成器
联想概率
基于实时联想
句子的生成
以“词-短语-句子”模式提高初中生英语书面表达能力
英语写作
书面表达
“词-短语-句子”模式
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于句子选择的关键短语生成
来源期刊 中文信息学报 学科
关键词 关键短语生成 文档结构 直通估计量 弱监督
年,卷(期) 2021,(8) 所属期刊栏目 信息抽取与文本挖掘|Information Extraction and Text Mining
研究方向 页码范围 64-72,81
页数 10页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1003-0077.2021.08.009
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (14)
共引文献  (6)
参考文献  (4)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(2)
  • 参考文献(0)
  • 二级参考文献(2)
2017(1)
  • 参考文献(0)
  • 二级参考文献(1)
2018(3)
  • 参考文献(1)
  • 二级参考文献(2)
2019(2)
  • 参考文献(0)
  • 二级参考文献(2)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
关键短语生成
文档结构
直通估计量
弱监督
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
论文1v1指导