《ROS理论与实践》学习笔记机器视觉处理

Posted 2021-05-21 Sakurazzy

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了《ROS理论与实践》学习笔记机器视觉处理相关的知识，希望对你有一定的参考价值。

《ROS理论与实践》学习笔记（六）机器视觉处理

课程内容
本讲作业
结语

在学习《ROS理论与实践》课程时，记录了学习过程中的编程练习，课后作业以及发现的问题，后续会对尚未解决的问题继续分析并更新，纯小白，仅供参考。
本次学习笔记关于课程中的第七讲：机器视觉处理。主要学习了ROS的USB摄像头启动、摄像头参数标定、OpenCV及Tensorflow案例的练习。

课程内容

1.ROS摄像头驱动及数据接口

usb摄像头功能包安装：

$ sudo apt-get install ros-melodic-usb-cam

启动usb摄像头并用rqt显示：

$ roslaunch usb_cam usb_cam-test.launch
$ rqt_image_view

usb摄像头具体数据接口见ROS Wiki：wiki usb_cam

在练习时发现了一些问题，与虚拟机的外设链接有关。
1.启动usb摄像头launch文件时出现如下警告：

[ERROR] Cannot identify '/dev/video0': 2, No such file or directory

在这里插入图片描述

解决方法：在虚拟机设置中勾上显示所有USB输入设备，重启后连接usb摄像头。
具体过程见博客：无法打开USB摄像头

2.如上成功连接摄像头后，启动launch文件又出现如下警告：

[ERROR] [1621304764.757189189]: select timeout

在这里插入图片描述解决方法：在1的基础上，将虚拟机的USB兼容性改为3.0即可

2.摄像头参数标定

安装calibration参数标定功能包：

$sudo apt-get install ros-melodic-camera-calibration

启动launch文件：

$ roslaunch robot_vision usb_cam.launch
$ rosrun camera_calibration cameracalibrator.py --size 8x6 --square 0.024 image:=/usb_cam/image_raw camera:=/usb_cam

其中size表示标定棋盘的内部角点个数，square表示每个棋盘格的边长，image和camera为设置摄像头发布的图像话题。
将标定靶进行平移和旋转直到X/Y/Size/Skew进度条均变为绿色后，点击CALIBRATE，存储得到如下的标定文件：
在这里插入图片描述

3.ROS+OpenCV图像处理方法及案例

ROS OpenCV功能包安装：

$ sudo apt-get install ros-melodic-vision-opencv libopencv-dev python-opencv

主要的API：

imgmsg_to_cv2() : 将ROS图像消息转换成OpenCV图像数据
cv2_to_imgmsg() : 将OpenCV格式的图像数据转换成ROS图像消息
输入参数：图像信息流；转换的图像数据格式

人脸识别案例流程：

初始化：完成ROS节点、图像、识别参数的设置
回调函数：将图像转换成OpenCV的数据格式，然后预处理之后开始调用人脸识别的功能函数，最后把识别结果发布
人脸识别：调用OpenCV提供的人脸识别接口，与数据库中的人脸特征进行匹配

$ roslaunch robot_vision usb_cam.launch
$ roslaunch robot_vision face_dector.launch
$ rqt_image_view

跟踪物体特征点案例流程：

初始化：完成ROS节点、图像、识别参数的设置
将图像转换成OpenCV格式，完成图像预处理之后开始针对两帧图像进行比较，基于图像差异识别到运动的物体，最后标识结果并发布

$ roslaunch robot_vision usb_cam.launch
$ roslaunch robot_vision motion_dector.launch
$ rqt_image_view

4.ROS+Tensorflow物体识别方法及案例

tensorflow安装:

$ sudo apt-get install python-pip python-dev python-virtualenv
$ virtualenv --system-site-packages ~/tensorflow
$ source ~/tensorflow/bin/activate
$ easy_install -U pip
$ pip install --upgrade tensorflow

剩余代码来自课程代码包，含有物体识别案例

$ roslaunch tensorflow_object_detector usb_cam_detector.launch

本讲作业

1.通过人脸识别方式，发布速度控制指令，控制仿真机器人运动

任务要求：小车根据人脸左右移动方向进行旋转，根据人脸前后移动方向进行移动
实现思路：通过人脸识别例程计算得到人脸的二维坐标点以及人脸大小，对应地写入Twist消息变量，并创建一个发布者vel_pub，向/cmd_vel话题发布Twist速度指令。

为了便于测试，自定义了一个msg消息类型facepos，并通过faceps_pub发布者，向/faceposition话题实时发布人脸位置和大小，其数据结构如下：

uint16 posx
uint16 posy
uint16 facesize

部分代码实现如下：

创建face_pub和vel_pub发布者

# 创建人脸位置话题faceposition,消息类型为自定义类型facepos
self.facepos_pub = rospy.Publisher("faceposition",facepos,queue_size=10)
# 创建一个Publisher，发布名为/cmd_vel的topic，消息类型为geometry_msgs::Twist，队列长度10
self.vel_pub = rospy.Publisher('/cmd_vel',Twist,queue_size=10)

将人脸数据和速度指令封装到facepos和Twist消息类型

# 将人脸位置信息封装到消息类型facepos中
# 将速度发布指令封装到消息类型Twist中
facepos_data = facepos()
vel_msg = Twist()

# 在opencv的窗口中框出所有人脸区域
if len(faces_result)>0:
    for face in faces_result: 
        x, y, w, h = face
        facepos_data.posx = x+w/2
        facepos_data.posy = y+h/2
        facepos_data.facesize = w*h
        cv2.rectangle(cv_image, (x, y), (x+w, y+h), self.color, 2)
        
# 当人脸偏左，则围绕z轴以0.2速度旋转，反之围绕z轴以-0.2速度旋转
if facepos_data.posx == 0:
    vel_msg.angular.z = 0
elif facepos_data.posx > 400:
	vel_msg.angular.z = 0.2
else:
    vel_msg.angular.z = -0.2
    
# 当人脸尺寸大于30000（靠前）则前进，反之则后退
if facepos_data.facesize == 0:
    vel_msg.linear.x = 0
elif facepos_data.facesize > 30000:
	vel_msg.linear.x = 0.5
else:
    vel_msg.linear.x = -0.5

发布指令

 # 发布速度指令
 self.vel_pub.publish(vel_msg)
 # 将识别后的图像转换成ROS消息并发布
 self.image_pub.publish(self.bridge.cv2_to_imgmsg(cv_image, "bgr8"))
 # 发布人脸位置信息
 self.facepos_pub.publish(facepos_data)

测试结果
可以通过echo相关的话题对程序进行测试：

$ topic echo /cmd_vel
$ topic echo /faceposition

得到结果如下图所示：
在这里插入图片描述运行Gazebo仿真程序，确实能够实现人脸识别对小车的控制，但是对于戴眼镜的人脸会有严重的跳变，人脸坐标频繁跳变为0，在实际应用中可以再加入跳变检测，并做一些滤波处理。

2.使用杯子识别发布速度控制指令，控制仿真机器人的运动

实现方法与第一题类似，后续更新。

ps.无法正常import自定义msg消息

在完成作业第一题时，在myrobot_vision功能包下创建msg文件夹，并建立了自定义msg消息facepos，用于发布人脸的实时坐标和尺寸，同第三讲的内容，对CMakeLists.txt和package.xml文件进行了修改，并使用如下代码进行import：

from myrobot_vision.msg import facepos

在运行代码时出现如下报错提示：

ImportError: No module named myrobot_vision.msg

在这里插入图片描述但是在学习时使用的learning_communication功能包下的msg文件夹中，同样建立facepos.msg消息，进行如下的import,代码能够运行成功：

from learning_communication.msg import facepos

解决方法：重启一下就好了…？可能是需要手动source一下？

结语

本讲学习了ROS的USB摄像头启动、摄像头参数标定、OpenCV及Tensorflow案例，通过作业巩固了话题通信以及本讲的视觉内容，做了一定的拓展。主要遇到的问题是自定义msg消息的导入，花费了很多的时间检查，最后也不知道怎么解决的…重启一下就好了。

以上是关于《ROS理论与实践》学习笔记机器视觉处理的主要内容，如果未能解决你的问题，请参考以下文章