基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对单张RGB-D图像进行六自由度目标位姿估计难以充分利用颜色信息与深度信息的问题,提出了一种基于多种网络(金字塔池化网络和PointNet++网络结合特征融合网络)构成的深度学习网络框架.方法用于估计在高度杂乱场景下一组已知对象的六自由度位姿.首先对RGB图像进行语义识别,将每一个已知类别的对象掩膜应用到深度图中,按照掩膜的边界框完成对彩色图与深度图进行语义分割;其次,在获取到的点云数据中采用FPS算法获取关键点,映射到彩色图像与深度图像中进行关键点特征提取,将RGB-D图像中的颜色信息与深度信息视为异构数据,考虑关键点需要充分融合局部信息与全局信息,分别采用了金子塔池化网络(pyramid scene parsing network,PSPNet)和PointNet++网络提取颜色信息与深度信息;采用一种新型的关键点特征融合方法,深度融合提取到颜色信息与几何信息的局部及全局特征,并嵌入到选定的特征点中;使用多层感知机(multilayer perceptron,MLP)输出每一个像素点的六自由度位姿和置信度,利用每一个像素点的置信度,让网络自主选择最优的估计结果;最后,利用一种端到端的迭代位姿求精网络,进一步提高六自由度位姿估计的准确度.网络在公开的数据集LineMOD和YCB-Video上进行测试,实验结果表明和现有同类型的六自由度位姿估计方法相比,本文所提出的模型预测的六自由度准确度优于现有的同类型方法,在采用相同的评价标准下,平均准确度分别达到了97.2%和95.1%,分别提升了2.9%和3.9%.网络同时满足实时性要求,完成每一帧图像的六自由度位姿预测仅需0.06 s.
推荐文章
基于单目视觉的工件位姿六自由度测量方法研究
单目视觉
工件位姿测量
六自由度
图像匹配
基于立体视觉六自由度大载荷实验平台的位姿检测
立体视觉
六自由度
大载荷
位姿检测
基于EtherCAT的并联六自由度平台设计
六自由度平台
EtherCAT
电子凸轮
三自由度并联姿态测量机构及其位姿显式解
并联机床
姿态测量
并联机构
测量仪
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于关键点特征融合的六自由度位姿估计方法
来源期刊 天津大学学报 学科 工学
关键词 六自由度位姿估计 深度学习 特征融合 机器视觉
年,卷(期) 2022,(5) 所属期刊栏目
研究方向 页码范围 543-551
页数 9页 分类号 TP391
字数 语种 中文
DOI 10.11784/tdxbz202101024
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
六自由度位姿估计
深度学习
特征融合
机器视觉
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
天津大学学报
月刊
0493-2137
12-1127/N
天津大学青年公寓B座414室
chi
出版文献量(篇)
4671
总下载数(次)
14
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导