2，一个人体姿态识别的项目实现

Posted 2021-10-18 奋斗的Brandon

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了2，一个人体姿态识别的项目实现相关的知识，希望对你有一定的参考价值。

学习opencv的例子

1，认识
2，start，直接干货

文档说明：

参考链接：
http://codec.wang/#/opencv/start/02-basic-element-image

1，认识

简单地放几张图片感受一下，opencv识别的人体
本项目基于pycharm python3.6 和anaconda4.0做的，仅供参考

2，start，直接干货

先来看一下这三个函数：

加载图片，显示图片，保存图片
OpenCV函数：

cv2.imread(参数1，参数2), 如img = cv2.imread('IU.jpg',0)

	加载成功显示图片，没有找到图片返回none，
	参数1，照片名字如： xx.jpg
	参数2：读入方式，省略即采用默认值
	cv2.IMREAD_COLOR：彩色图，默认值(1)
	cv2.IMREAD_GRAYSCALE：灰度图(0)
	cv2.IMREAD_UNCHANGED：包含透明通道的彩色图(-1)

cv2.imshow(参数1，参数2),如：cv2.imshow('IU',img)

cv2.imwrite()，如cv2.imwrite('IU.jpg', img)

例子1

显示一个图片的灰度图，挑选一张图片保存到这个工程下面即可

# -*- coding: utf-8 -*-

import cv2

img = cv2.imread('IU.jpg',0)#加载成功显示图片，没有找到图片返回none，第二个参数0看最后几行介绍
cv2.namedWindow('IU', cv2.WINDOW_NORMAL)#建立一个IU的窗口，参数2默认是cv2.WINDOW_AUTOSIZE，表示窗口大小自适应图片，也可以设置为cv2.WINDOW_NORMAL，表示窗口大小可调整。图片比较大的时候，可以考虑用后者。
cv2.imshow('IU',img)
cv2.waitKey(0) #让窗口显示停留 参数是等待时间（毫秒ms）。时间一到，会继续执行接下来的程序，传入0的话表示一直等待

例子2

学习打开摄像头捕获照片、播放本地视频、录制视频等

打开摄像头并捕获照片
播放本地视频，录制视频
OpenCV函数：cv2.VideoCapture(), cv2.VideoWriter()

打开摄像头，并灰度化显示，键盘上按q退出

# 打开摄像头并灰度化显示
import cv2

capture = cv2.VideoCapture(0)

while(True):
    # 获取一帧
    ret, frame = capture.read()
    # 将这帧转换为灰度图
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    cv2.imshow('frame', gray)
    # 获取捕获的分辨率
    # propId可以直接写数字，也可以用OpenCV的符号表示
    width, height = capture.get(3), capture.get(4)
    print(width, height)

    # 以原分辨率的一倍来捕获
    # capture.set(cv2.CAP_PROP_FRAME_WIDTH, width * 2)
    # capture.set(cv2.CAP_PROP_FRAME_HEIGHT, height * 2)
    if cv2.waitKey(1) == ord('q'):
        break

灰度播放一段视频：

# 播放本地视频
capture = cv2.VideoCapture('demo_video.mp4')

while(capture.isOpened()):
    ret, frame = capture.read()
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    cv2.imshow('frame', gray)
    if cv2.waitKey(30) == ord('q'):
        break

录制视频：

capture = cv2.VideoCapture(0)

# 定义编码方式并创建VideoWriter对象
fourcc = cv2.VideoWriter_fourcc(*'MJPG')#FourCC是用来指定视频编码方式的四字节码。如MJPG编码可以这样写
outfile = cv2.VideoWriter('output.avi', fourcc, 25., (640, 480))#输出的文件名，如'output.avi'
编码方式FourCC，帧率FP，要保存的分辨率大小

while(capture.isOpened()):
    ret, frame = capture.read()

    if ret:
        outfile.write(frame)  # 写入文件
        cv2.imshow('frame', frame)
        if cv2.waitKey(1) == ord('q'):
            break
    else:
        break

例子3

ROI
ROI：Region of Interest，感兴趣区域。什么意思呢？比如我们要检测眼睛，因为眼睛肯定在脸上，所以我们感兴趣的只有脸这部分，其他都不care，所以可以单独把脸截取出来，这样就可以大大节省计算量，提高运行速度。

获取图像的ROI区域，如获取下图图片左眼的区域

先找到眼睛区域的值：运行下面代码然后移动鼠标获取像素点的x,y的值并记录下来
我记录的x，y的值为：53,122 ————106,169

import cv2

img = cv2.imread('pic.jpg',1)

cv2.imshow('face', img)
cv2.waitKey(0)

然后切记img【先是y，后是x】，行对应y，列对应x，所以其实是img[y, x]，需要注意噢(●ˇ∀ˇ●)。容易混淆的话，可以只记行和列，行在前，列在后。

import cv2

img = cv2.imread('pic.jpg',1)

p = img[ 120:170, 50:100]
cv2.imshow('face', p)
cv2.waitKey(0)

下一个例子

import cv2

img = cv2.imread('IU.jpg',1)

p = img[ 594:835, 270:595]
cv2.imshow('face', p)

# cv2.namedWindow('IU', cv2.WINDOW_NORMAL)
# cv2.imshow('IU',img)  #先运行注释掉的代码，用鼠标缺点脸部区域的坐标


cv2.waitKey(0)

通过行列的坐标来获取某像素点的值，对于彩色图，结果是B,G,R三个值的列表，对于灰度图或单通道图，只有一个值：

px = img[100, 90]
print(px)  # [103 98 197]

# 只获取蓝色blue通道的值
px_blue = img[100, 90, 0]
print(px_blue)  # 103

例子4

提取下面这张图的蓝色部分

HSV是一个常用于颜色识别的模型，相比BGR更易区分颜色，转换模式用COLOR_BGR2HSV表示。
cv2.cvtColor()函数用来进行颜色空间转换，常用BGR↔Gray，BGR↔HSV。
HSV颜色模型常用于颜色识别。要想知道某种颜色在HSV下的值，可以将它的BGR值用cvtColor()转换得到。

import cv2
import numpy as np

img = cv2.imread('color_blue.png',1) #图片导入

# 蓝色的范围，不同光照条件下不一样，可灵活调整
lower_blue = np.array([100, 110, 110])
upper_blue = np.array([130, 255, 255])

hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV) #BGR转HSV
mask = cv2.inRange(hsv, lower_blue, upper_blue) #inRange()：介于lower/upper之间的为白色，其余黑色
res = cv2.bitwise_and(img, img, mask=mask)#只保留原图中的蓝色部分

cv2.imshow('img', img)
cv2.imshow('mask', mask)
cv2.imshow('res', res)
cv2.waitKey(0)

那蓝色的HSV值的上下限lower和upper范围是怎么得到的呢？其实很简单，我们先把标准蓝色的BGR值用cvtColor()转换下：

blue = np.uint8([[[255, 0, 0]]])
hsv_blue = cv2.cvtColor(blue, cv2.COLOR_BGR2HSV)
print(hsv_blue)  # [[[120 255 255]]]

结果是[120, 255, 255]，所以，我们把蓝色的范围调整成了上面代码那样。

例子5

使用固定阈值、自适应阈值和Otsu阈值法"二值化"图像

固定阈值

分割很直接，一句话说就是像素点值大于阈值变成一类值，小于阈值变成另一类值。

自适应阈值

看得出来固定阈值是在整幅图片上应用一个阈值进行分割，它并不适用于明暗分布不均的图片。 cv2.adaptiveThreshold()自适应阈值会每次取图片的一小部分计算阈值，这样图片不同区域的阈值就不尽相同。

OpenCV函数：

 cv2.threshold()#如：进行固定阈值分割，ret, th1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)

 cv2.adaptiveThreshold()#进行自适应阈值分割，它有6个参数，如th2 = cv2.adaptiveThreshold(
    img, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 4)

**cv2.threshold()**用来进行固定阈值分割。固定阈值不适用于光线不均匀的图片
所以用 cv2.adaptiveThreshold()进行自适应阈值分割。
二值化跟阈值分割并不等同。针对不同的图片，可以采用不同的阈值方法。

**cv2.threshold()**用来实现阈值分割，ret是return value缩写，代表当前的阈值，暂时不用理会。函数有4个参数：

参数1：要处理的原图，一般是灰度图
参数2：设定的阈值
参数3：对于THRESH_BINARY、THRESH_BINARY_INV阈值方法所选用的最大阈值，一般为255
参数4：阈值的方式，主要有5种

cv2.adaptiveThreshold()
参数1：要处理的原图
参数2：最大阈值，一般为255
参数3：小区域阈值的计算方式
ADAPTIVE_THRESH_MEAN_C：小区域内取均值
ADAPTIVE_THRESH_GAUSSIAN_C：小区域内加权求和，权重是个高斯核
参数4：阈值方法，只能使用THRESH_BINARY、THRESH_BINARY_INV，具体见前面所讲的阈值方法
参数5：小区域的面积，如11就是11*11的小块
参数6：最终阈值等于小区域计算出的阈值再减去此值


# 应用5种不同的阈值方法
ret, th1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)//二分
ret, th2 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)//倒置二分
ret, th3 = cv2.threshold(img, 127, 255, cv2.THRESH_TRUNC)//切割
ret, th4 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO)//切割二分
ret, th5 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO_INV)//倒置切割二分

分别为：'BINARY', 'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV'''

这五种阈值方式分别为：

——————————————————————————————

使用如下图片进行固定阈值分割：

import cv2

# 灰度图读入
img = cv2.imread('yuzhi1.png', 0)

# 阈值分割
ret, th = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)#可更改127的值看看，参数2的值越小，黑色区域越少
cv2.imshow('thresh', th)
cv2.waitKey(0)

import cv2

# 灰度图读入
img = cv2.imread('yuzhi1.png', 0)

# 阈值分割
ret, th = cv2.threshold(img, 80, 255, cv2.THRESH_BINARY)
ret, th2 = cv2.threshold(img, 80, 255, cv2.THRESH_BINARY_INV)#倒置二分
cv2.imshow('thresh', th)
cv2.imshow('thresh2', th2)
cv2.waitKey(0)

先把代码复制进去，然后根据错误提示，点击波浪线安装matplotlib包即可。

import cv2
import matplotlib.pyplot as plt


# 灰度图读入
img = cv2.imread('yuzhi1.png', 0)

# 应用5种不同的阈值方法
ret, th1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
ret, th2 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)
ret, th3 = cv2.threshold(img, 127, 255, cv2.THRESH_TRUNC)
ret, th4 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO)
ret, th5 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO_INV)

titles = ['Original', 'BINARY', 'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV']
images = [img, th1, th2, th3, th4, th5]

# 使用Matplotlib显示
for i in range(6):
    plt.subplot(2, 3, i + 1)
    plt.imshow(images[i], 'gray')
    plt.title(titles[i], fontsize=8)
    plt.xticks([]), plt.yticks([])  # 隐藏坐标轴

plt.show()

————————————————————————————————
用自适应阈值来处理一个数独图片
————————————————————————————————

import cv2
import matplotlib.pyplot as plt
# 自适应阈值对比固定阈值
img = cv2.imread('zishiying.png', 0)

# 固定阈值
ret, th1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
# 自适应阈值
th2 = cv2.adaptiveThreshold(
    img, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 4)
th3 = cv2.adaptiveThreshold(
    img, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 17, 6)

titles = ['Original', 'Global(v = 127)', 'Adaptive Mean', 'Adaptive Gaussian']
images = [img, th1, th2, th3]

for i in range(4):
    plt.subplot(2, 2, i + 1), plt.imshow(images[i], 'gray')
    plt.title(titles[i], fontsize=8)
    plt.xticks([]), plt.yticks([])
plt.show()

以上是关于2，一个人体姿态识别的项目实现的主要内容，如果未能解决你的问题，请参考以下文章

二维已经 OUT 了？3DPose 实现三维人体姿态识别真香 | 代码干货

Python 三维姿态估计+Unity3d 实现 3D 虚拟现实交互游戏

目标跟踪的深度学习方法与opencv实现

基于mediapipe的姿态识别和简单行为识别

基于Mediapipe与Unity的人体姿态捕捉系统

Openpose+Tensorflow 这样实现人体姿态估计 | 代码干货