基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
关键词语义敏感影响短文本选择关键词赋予合适权重.针对仅关注关键词是否完备没有考虑到混淆关键词会对分类造成消极影响的问题,提出一种降低混淆关键词权重实现关键词权重优化的模型.首先,基于词频?逆文件频率(TF-IDF)和混淆矩阵的原理选择文本中被定义的混淆关键词.然后,基于注意力机制构建文本表征,通过全连接层降维重构表征;训练重构的表征尽可能相似于原表征,从而选出能保留句子信息的关键词;将混淆关键词从提取的关键词里排除出去,将筛选后的关键词称为强关键词.最后,使用双向长短记忆网络?注意力机制(BiLSTM-Attention)经典模型作短文本多分类的基础模型.在此基础模型之上把强关键词整体做嵌入表示加入到BiLSTM-Attention模型中的注意力部分激活函数计算当中.与BiLSTM-Attention基础模型进行的实验结果表明,所提模型在Snippets公开数据集上,分类准确率提高0.41个百分点.
推荐文章
基于关键词相似度的短文本分类方法研究
词向量
特征选择
短文本分类
特征权重
基于自注意力机制的方面情感分类
方面词
情感分类
自注意力机制
语义编码
基于语义的关键词过滤权重算法
向量空间模型
网页过滤
权重策略
矩阵词典
基于新的关键词提取方法的快速文本分类系统
计算机应用
中文信息处理
关键词提取
Web文档分类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于注意力机制面向短文本多分类的关键词权重优化
来源期刊 计算机应用 学科 工学
关键词 词频 重构文本 关键词 注意力机制 权重优化
年,卷(期) 2021,(z2) 所属期刊栏目 人工智能|Artificial intelligence
研究方向 页码范围 19-24
页数 6页 分类号 TP389.1
字数 语种 中文
DOI 10.11772/j.issn.1001-9081.2021030461
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
词频
重构文本
关键词
注意力机制
权重优化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导