针对双目视觉定位中对物体类别与距离远近判定的实际需求,提出了一种结合实例分割与特征点匹配的定位方法,准确地实现了目标的识别和定位.该方法通过Mask Region with Convolution Neural Network Feature(Mask R-CNN)对双目相机采集到的左图像特进行目标检测和分割,采用SURF算法提取分割区域的特征点并与右图特征点进行匹配得到视差,利用双目视差测距原理计算出目标相对于摄像头的位置.同时,针对相机自身标定误差造成在远距离情况下目标定位误差逐渐变大的问题,采用了最小二乘法对视差进行拟合.实验结果表明,该方法不仅能够精准实现目标识别,而且与未经拟合处理结果相比,平均误差值由0.183 m降低到0.106 m,定位精度得到了显著提高.