一:视觉伺服现状
上世纪六十年代初,美国有人着手研究带有视觉传感器的机器人,所研究的视觉系统只能识别点、线、圆等简单的特征
1973年,shirai Y,Inoue H 首次提出了具有视觉功能的智能机器人,但都是以静态的方式工作。首先由视觉系统采集目标图像并计算出机械手运动的位姿,然后是控制末端执行器到指定位姿位置。这是一种开环的系统,且定位对象为静止目标,导致定位精度较差。
1979年,首次提出使用移动相机对机器人进行real time control,这也算是首次提出“视觉伺服”的论述,将视觉反馈信息引入到闭环系统中,从而可以有效地克制系统建模的不确定性等因素
上世纪八十年代末,随着CCD和计算机技术的迅速发展,美国、日本等发达国家都在视觉伺服的理论与应用方面取得了较大的进展
直到上世纪末,哈工大、浙江大学、国防科技大学等研究单位才开始着手研究机器人的视觉伺服技术。
近年来,国内外的科研人员尽管在视觉伺服技术领域取得了较大的进步,其应用范围越来越广,但有很多问题亟待解决:
1、外界三维图像信息映射到二维图像上造成深度信息缺失的问题。它导致不能充分利用深度信息进行重建三维场景,从而影响识别或跟踪目标的精确度。
2、还有如何有效地去除图像噪声的问题,由于目标周围环境的光线不均匀,对目标图像造成很大的影响,使得图像特征变得模糊,甚至造成对目标识别失败等现象的发生。
3、研究针对特定领域且具有较强鲁棒性控制方法,以及如何让视觉传感器等设备不受核辐射的方法
二:视觉伺服结构
1、开环控制系统:将采集到的图像信息按照事先确定的模型计算出目标在任务工作空间的位姿信息,然后发送给机器人控制器以引导机器人完成作业任务。
闭环控制系统:从系统的视觉信息中提取特征信息与期望特征进行比较,将比较结果反馈给机器人控制器,从而能够控制机器人的运动。此方法在一定程度
上降低了建模误差带来的影响,但需要掌握先进的视觉信息处理技术和模式识别技术。
(模式识别是指对表征事物或现象的各种形式的信息进行处理和分析,以对事物或现象进行描述、辨识、分类和解释的过程,是信息科学和人工智能的重要组成部分)
2、基于位置反馈的视觉伺服:首先提取目标特征,再估计位姿,并计算出控制信号,最终实现抓取目标,这种系统的定位精确度受到位姿精度等的影响。
基于图像反馈的视觉伺服:系统根据反馈目标图像与期望目标图像进行配准,并计算出图像差信号,由此信号进一步计算出控制量
3、静态视觉伺服:“look then move”在采集图像之前先让目标停止运动,这种控制方式具有反馈图像清晰等优点,在速度要求不高的静态目标定位中是一种可 接受的方式,不适合高速运动的目标。
动态视觉伺服:同步执行的方式工作,在采集图像之前不需要让目标停止运动,即“look and move”,这种系统需具备对图像数据进行高速并行处理的能力
4、Eye in hand:摄像机安装在机械手的端部,能够避免在空间运动时目标的视线受到遮挡的问题,缺点是机械手运动时所受的随机干扰很容易造成所获得的图像变得模糊
Eye to hand:将摄像机固定在有利于观测目标与机械手相对位姿且尽量不受光线噪声干扰的某个空间位置,目标不会超过摄像机视野,缺点是在机械手运动时可能会出现视线遮挡,若系统使用了多个摄像头,且安装角度各不相同,这种系统称为“多目”系统,这样可以很好的提高系统的定位精度,但也增加了图像算法的复杂度
总之,基于图像的动态闭环视觉伺服控制系统才是主流,至于到底是eyeinhand还是eyetohand,要看机器人应用的场景和所需实现的功能,不可一概而论
三:视觉研究方法
目前,越来越多的学者将主动视觉技术应用于机器人视觉系统,所谓主动视觉是指对于人类的视觉来说,并非外界图像信息映现在视网膜上即可看见,只有在人们想要看的努力之后人类才能看到外界信息,把人类这种想要看的努力移植到机器人的图像处理中,称为主动视觉。在传感器方面,主动视觉传感器中心周围的分辨率高于中心外围的分辨率,这样就既能对场景整体做宏观的观察,也能对特定部分做详细的辨认,如果采用多目视觉系统,则还需要对各个分系统进行最佳的组合以获得最佳的性能。其余的视觉实现方式如下:动画视觉,实时视觉,机器人视觉
为了使机器人能够全面的感知周围环境,如何组合传感器至关重要,从组合的效果看,可以将其分为竞争和互补两种组合。竞争组合是指从多个传感器获得对象的位置信息后,比较彼此的精度、可靠性等特性,进而选择能够估计出准确位置信息的算法。互补组合是指某个系统使用图像装置检测目标对象的范围,使用距离传感器检测和评价物体的形状等,根据组合信息准确估计出目标位置信息,当然这要解决系统信息组合与冗余的问题
由于目标特征带有光线等不均匀的噪声,导致可靠地获取目标图像特征具有相当大的难度,目前虽然有基于块匹配、红外及背景建模等分割图像特征的方法,但都缺乏鲁棒性。而支持向量机方法综合了机器学习、统计学习、VC维理论及神经网络等多个学科知识的一套理论体系,特别是针对图像等非线性数据中具有较好分类效果。1992年,vapnik等人首次提出了最优分类问题,1995年vapnik才将最终完整解决了最优分类问题的方法称为支持向量机,该方法具有学习分类的功能,并且与样本的数目无关,而且在理论上可以得到全局的最优解等优点,因此支持向量机在图像前景和背景分割中得到广泛的应用。
支持向量机方法所处理的数据是目标特征数据,而不是针对具体的目标图像,因此确定目标特征样本对支持向量机方法至关重要,并保证样本的独立性和完整性,在此情况下支持向量机方法能够依据不同的目标特征类型进行正确无误地分类