原文服务方: 微电子学与计算机       
摘要:
针对自然街景文本角度倾斜、形状弯曲、长度不定等特点,提出一种基于注意力机制的 自然街景文本检测方法,通过利用注意力机制的优势,对主干网络提取的特征进行加权融合,从而提升整体网络的检测性能.首先,针对特征金字塔(FPN)横向连接中特征信息丢失的问题,引入注意力融合模块AFFM(Attention Feature Fusion Module),通过计算高维和低维特征的融合权重,来改进原FPN中简单直接相加的特征融合方式,从而减少FPN特征融合过程中文本信息丢失,增强网络的特征提取能力.其次,针对不同尺度特征图中的文本特征,引入一个子空间注意力模块SAM(Subspace Attention Module),通过将多尺度融合特征图按通道划分为数个子空间特征图,分别学习每个子空间中的文本特征权重,使得融合后的特征图包含更多不同尺度的文本特征,从而增强融合特征图对文本实例的表征能力,进而提升网络的检测效果.在公开数据集Total-Text上对模型进行评估,实验结果表明,该算法与目前快速高效的DBNet相比,准确率、召回率和F值分别提高了 0.5%、0.4%和0.4%.
推荐文章
基于内容理解的单幅静态街景图像深度估计
特征提取
景物分类
小孔成像模型
深度估计
基于深度学习的病毒检测综述
深度学习
病毒检测
识别分类
特征降维
高维信息
人工神经网络
基于深度迁移学习的网络入侵检测
深度自编码器
迁移学习
入侵检测
嵌入层
标签层
基于深度学习的文本挖掘研究
深度学习
文本挖掘
特征融合
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于深度学习的街景下的文本检测
来源期刊 微电子学与计算机 学科 工学
关键词 文本检测 注意力机制 特征增强 特征融合注意力 子空间注意力
年,卷(期) 2023,(2) 所属期刊栏目 图像处理
研究方向 页码范围 85-92
页数 8页 分类号
字数 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2023(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本检测
注意力机制
特征增强
特征融合注意力
子空间注意力
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
微电子学与计算机
月刊
1000-7180
61-1123/TN
大16开
1972-01-01
chi
出版文献量(篇)
9826
总下载数(次)
0
总被引数(次)
59060
论文1v1指导