机器视觉是人工智能正在快速发展的一个分支。简单说来,机器视觉就是用机器代替人眼来做测量和判断。但由于机器视觉是一门交叉学科,涉及数字图像处理技术、模式识别、自动控制、照明、人机界面等多个领域。因此,很难给机器视觉下一个准确的定义。
制造工程学会(SME)和机器人工业协会(RIA)将机器视觉定义为:机器视觉利用光学和非接触式传感器自动获取和解释真实物体的图像,以获取有用的信息来控制机器的运动或过程控制。
在机器视觉系统中,其基本工作流程为:首先照明光源发出的光照射在被测物体上;然后再通过镜头成像后由相机捕获;随后,由图像采集卡收集并经计算机处理;最后,以预先设计的图像形式显示在计算机屏幕上,如图1所示。在这其中,机器视觉成像系统的成像质量决定了整体机器视觉系统的检测精度,发挥着极为重要的作用。
图1 机器视觉系统工作流程示意图
机器视觉成像的一个重要特点是从图像中获取目标的信息,传统视觉成像主要依赖于2D视觉技术:根据灰度或彩色图像中的像素灰度特征获取目标中物体的纹理、形状、位置、尺寸和方向等信息。但随着当前“智能制造”技术对机器视觉性能的要求逐渐增高,2D视觉技术的局限性愈发明显,迫切需要3D视觉成像技术的发展及应用。
目前,3D视觉成像技术主要依赖于飞行时间法(TOF)、结构光法、立体视觉法、三角测量法和调频连续波(FMCW)法等实现对目标3D信息的感知和收集。
一、TOF法
TOF法的基本工作原理为利用光飞行的时间差来获取物体的深度:探测系统与光源同时启动,发射的光脉冲经目标物体后反射回探测中并由探测系统直接存储往返时间,最后根据时间和光速的关系求得与目标物体之间的距离。
这种测试方法也称为直接TOF法(D-TOF),通常适用于单点测距系统,与扫描技术相结合便可实现3D视觉成像。
图2 PMD公司的工业TOF相机以及基于TOF法的自动导引叉车示意图
TOF成像可用于大视野、远距离、低精度、低成本的3D图像采集。其特点是:检测速度快、视野范围较大、工作距离远、价格便宜,但精度低,易受环境光的干扰。
二、结构光法
结构光投影3D成像目前是机器人3D视觉感知的主要方式,结构光成像系统是由若干个投影仪和相机组成,如图3所示,常用的结构形式有:单投影仪单相机、单投影仪-双相机、单投影仪多相机、单相机-双投影仪和单相机多投影仪等典型结构形式。
图3 基于红外结构光的深度相机:Astra Stereo S U3
结构光投影3D成像的基本工作原理是:利用计算机生成结构光图案或用特殊的光学装置产生结构光,经过光学投影系统投射至被测物体表面,然后采用图像获取设备(如CCD或CMOS相机)采集被物体表面调制后发生变形的结构光图像,利用图像处理算法计算图像中每个像素点与物体轮廓上点的对应关系;最后通过系统结构模型及其标定技术,计算得到被测物体的三维轮廓信息,如图4所示。根据结构光投影次数划分,结构光投影3D成像可以分成单次投影3D成像和多次投影3D成像方法。
图4 结构光投影3D成像的基本工作原理图
其中,单次投影3D成像方法曝光和测量时间短,抗振动性能好,适合机器人实时运动引导和手眼机器人等需要对运动物体进行3D成像的应用。但该方法景深较低,无法在大视场情况下获得较高的垂直空间分辨率。
而多次投影3D成像方法恰能实现较高的空间分辨率,能有效解决目标表面斜率阶跃变化的问题,但也具有相应的不足之处:抗振动性能较差,无法准确的测量连续运动的物体;测量精度对投影仪、相机的环境变化敏感;实时性相对较差。
三、立体视觉法