基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文档分类是自然语言处理(NLP)领域中的一个基本问题.近年来,尽管针对这一问题的层级注意力网络已经取得了进展,但由于每条句子被独立编码,使得模型中使用的双向编码器仅能考虑到所编码句子的相邻句子,仍然集中于当前所编码的句子,并没有有效地将文档结构知识整合到体系结构中.针对此问题,提出一种上下文感知与层级注意力网络的文档分类方法(CAHAN).该方法采用分层结构来表示文档的层次结构,使用注意力机制考虑文档中重要的句子和句子中重要的单词因素,在单词级和句子级不仅依赖双向编码器来获取上下文信息,还通过在单词级注意机制中引入上下文向量,使单词级编码器基于上下文信息做出注意决策全面获取文本的上下文信息,从而提取出深度文档特征.此外,还利用门控机制准确地决定应该考虑多少上下文信息.在两个标准数据集上的实验结果表明,提出的CAHAN模型较长短时记忆网络(LSTM)、卷积神经网络(CNN)、分层注意网络(HAN)等模型分类效果更好,能够提高文档分类任务的准确度.
推荐文章
基于进程代数的上下文感知模型
移动计算
上下文感知
进程代数
染色Petri网
语用网驱动的上下文感知系统设计
语用网
上下文
上下文本体
上下文获取技术
智能体
支持上下文感知服务的中间件原型
中间件原型
上下文感知
服务
传感器网络
基于上下文感知的移动协同标绘模型
移动计算
移动协同
协同标绘
上下文感知
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 上下文感知与层级注意力网络的文档分类方法
来源期刊 计算机科学与探索 学科 工学
关键词 自然语言处理(NLP) 文档分类 上下文感知 层级注意力 门控机制
年,卷(期) 2021,(2) 所属期刊栏目 人工智能
研究方向 页码范围 305-314
页数 10页 分类号 TP391
字数 语种 中文
DOI 10.3778/j.issn.1673-9418.1912048
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (12)
共引文献  (13)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1997(3)
  • 参考文献(1)
  • 二级参考文献(2)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(3)
  • 参考文献(0)
  • 二级参考文献(3)
2014(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(3)
  • 参考文献(0)
  • 二级参考文献(3)
2017(1)
  • 参考文献(0)
  • 二级参考文献(1)
2018(3)
  • 参考文献(3)
  • 二级参考文献(0)
2019(2)
  • 参考文献(2)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
自然语言处理(NLP)
文档分类
上下文感知
层级注意力
门控机制
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学与探索
月刊
1673-9418
11-5602/TP
大16开
北京市海淀区北四环中路211号北京619信箱26分箱
82-560
2007
chi
出版文献量(篇)
2215
总下载数(次)
4
论文1v1指导