如何使用 OpenCV 在 Python 中找到图像的平均颜色?
Posted
技术标签:
【中文标题】如何使用 OpenCV 在 Python 中找到图像的平均颜色?【英文标题】:How to find the average colour of an image in Python with OpenCV? 【发布时间】:2017-08-23 23:24:16 【问题描述】:我试过这段代码:
import cv2
image = cv2.imread("sample.jpg")
pixel = image[200, 550]
print pixel
但我得到的错误是:
'Nonetype'没有属性错误getitem
执行第三行代码后显示此错误。
【问题讨论】:
见***.com/a/47859322/1497139 【参考方案1】:如何修复错误
发生此错误的可能原因有两个:
-
文件名拼写错误。
图像文件不在当前工作目录中。
要解决此问题,您应确保文件名拼写正确(请注意区分大小写以防万一)并且图像文件位于当前工作目录中(这里有两个选项:您可以更改当前工作目录在您的 IDE 中或指定文件的完整路径)。
平均颜色与主要颜色
然后要计算“平均颜色”,您必须确定您的意思。在灰度图像中,它只是图像中灰度级的平均值。颜色通常通过 3 维向量表示,而灰度级是标量。
平均颜色是所有像素的总和除以像素数。但是,这种方法可能会产生与最突出的视觉颜色不同的颜色。您可能真正想要的是主色,而不是平均色。
实施
让我们慢慢看代码。我们首先导入必要的模块并读取图像:
import cv2
import numpy as np
from skimage import io
img = io.imread('https://i.stack.imgur.com/DNM65.png')[:, :, :-1]
然后我们可以按照@Ruan B 提出的方法来计算每个半音通道的平均值:
average = img.mean(axis=0).mean(axis=0)
接下来我们应用k-means clustering 来创建具有图像最具代表性颜色的调色板(在这个玩具示例中,n_colors
设置为5
)。
pixels = np.float32(img.reshape(-1, 3))
n_colors = 5
criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 200, .1)
flags = cv2.KMEANS_RANDOM_CENTERS
_, labels, palette = cv2.kmeans(pixels, n_colors, None, criteria, 10, flags)
_, counts = np.unique(labels, return_counts=True)
最后,主要颜色是在量化图像上出现频率最高的调色板颜色:
dominant = palette[np.argmax(counts)]
结果比较
为了说明这两种方法之间的区别,我使用了以下示例图片:
得到的平均颜色值,即分量是三个颜色通道的均值的颜色,与通过 k-means 聚类计算的主色有很大不同:
In [30]: average
Out[30]: array([91.63179156, 69.30190754, 58.11971896])
In [31]: dominant
Out[31]: array([179.3999 , 27.341282, 2.294441], dtype=float32)
让我们看看这些颜色的外观,以便更好地了解两种方法之间的差异。下图左侧显示的是平均颜色。很明显,计算出的平均颜色并不能正确描述原始图像的颜色内容。事实上,原始图像中没有一个像素具有该颜色。右图为最有代表性的五种颜色,按照重要性(出现频率)从上到下排序。这个调色板清楚地表明主色是红色,这与原始图像中最大的均匀颜色区域对应于红色乐高积木的事实是一致的。
这是用于生成上图的代码:
import matplotlib.pyplot as plt
avg_patch = np.ones(shape=img.shape, dtype=np.uint8)*np.uint8(average)
indices = np.argsort(counts)[::-1]
freqs = np.cumsum(np.hstack([[0], counts[indices]/float(counts.sum())]))
rows = np.int_(img.shape[0]*freqs)
dom_patch = np.zeros(shape=img.shape, dtype=np.uint8)
for i in range(len(rows) - 1):
dom_patch[rows[i]:rows[i + 1], :, :] += np.uint8(palette[indices[i]])
fig, (ax0, ax1) = plt.subplots(1, 2, figsize=(12,6))
ax0.imshow(avg_patch)
ax0.set_title('Average color')
ax0.axis('off')
ax1.imshow(dom_patch)
ax1.set_title('Dominant colors')
ax1.axis('off')
plt.show(fig)
TL;DR 答案
总而言之,尽管计算平均颜色 - 正如@Ruan B. 的回答中所建议的那样 - 是正确的,但产生的结果可能无法充分代表图像的颜色内容。更明智的方法是通过矢量量化(聚类)确定主色。
【讨论】:
注意:使用 cv2(2.4.8) ,需要将cv2.kmeans(pixels, n_colors, None, criteria, 10, flags)
更改为 cv2.kmeans(pixels, n_colors, criteria, 10, flags)
。文档:docs.opencv.org/2.4/modules/core/doc/clustering.html
为什么我们不能只取平均 R 值、平均 G 值和平均 B 值(跨所有像素)并检查图像是否更红、更绿或更蓝?
@Tonechas 在计算dominant_color 时,您说您将其计算为量化图像中出现频率最高的颜色,但您从未使用此变量。如果我们删除量化变量,脚本将以相同的方式工作。这是一个错误还是我遗漏了什么?
@nachmr: dominant_color
用于交互式会话和生成最后一个图的代码中,以显示两种方法之间的差异。我编辑了我的答案以包含该代码并使这一点更清楚。
这个答案很好,除了它说“平均向量没有意义”。当然可以。计算一组向量的平均值是完全有效的,结果作为输入向量的平均值是有意义的。对于 RGB 空间中的向量,结果是平均 RGB 值、平均颜色,并且在数学上完全正确。 “将图像分成其色彩分量并取每个分量的平均值是一种可能的方法。”是的,在数学上相当于计算平均向量。【参考方案2】:
我能够通过使用以下方法获得平均颜色:
import cv2
import numpy
myimg = cv2.imread('image.jpg')
avg_color_per_row = numpy.average(myimg, axis=0)
avg_color = numpy.average(avg_color_per_row, axis=0)
print(avg_color)
结果:
[ 197.53434769 217.88439451 209.63799938]
Great Resource which I referenced
【讨论】:
感谢您提供这个简短而高效的代码。它返回 [blue, green, red] 而不是 [red, green, blue] 顺序 @MohsenHaddadi 很明显,因为 cv2 以 BGR 格式读取图像。 我收到这个错误,你知道为什么吗? ImportError: numpy.core.multiarray failed to import Traceback (最近调用最后一次): File "/Users/luca/Desktop/example.py", line 1, in使用K-Means Clustering 确定图像中的主色的另一种方法sklearn.cluster.KMeans()
输入图片
结果
对于n_clusters=5
,这里是最主要的颜色和百分比分布
[76.35563647 75.38689122 34.00842057] 7.92%
[200.99049989 31.2085501 77.19445073] 7.94%
[215.62791291 113.68567694 141.34945328] 18.85%
[223.31013152 172.76629675 188.26878339] 29.26%
[234.03101989 217.20047979 229.2345317 ] 36.03%
每个颜色簇的可视化
与n_clusters=10
相似,
[161.94723762 137.44656853 116.16306634] 3.13%
[183.0756441 9.40398442 50.99925105] 4.01%
[193.50888866 168.40201684 160.42104169] 5.78%
[216.75372674 60.50807092 107.10928817] 6.82%
[73.18055782 75.55977818 32.16962975] 7.36%
[226.25900564 108.79652434 147.49787087] 10.44%
[207.83209569 199.96071651 199.48047163] 10.61%
[236.01218943 151.70521203 182.89174295] 12.86%
[240.20499237 189.87659523 213.13580544] 14.99%
[235.54419627 225.01404087 235.29930545] 24.01%
import cv2, numpy as np
from sklearn.cluster import KMeans
def visualize_colors(cluster, centroids):
# Get the number of different clusters, create histogram, and normalize
labels = np.arange(0, len(np.unique(cluster.labels_)) + 1)
(hist, _) = np.histogram(cluster.labels_, bins = labels)
hist = hist.astype("float")
hist /= hist.sum()
# Create frequency rect and iterate through each cluster's color and percentage
rect = np.zeros((50, 300, 3), dtype=np.uint8)
colors = sorted([(percent, color) for (percent, color) in zip(hist, centroids)])
start = 0
for (percent, color) in colors:
print(color, ":0.2f%".format(percent * 100))
end = start + (percent * 300)
cv2.rectangle(rect, (int(start), 0), (int(end), 50), \
color.astype("uint8").tolist(), -1)
start = end
return rect
# Load image and convert to a list of pixels
image = cv2.imread('1.png')
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
reshape = image.reshape((image.shape[0] * image.shape[1], 3))
# Find and display most dominant colors
cluster = KMeans(n_clusters=5).fit(reshape)
visualize = visualize_colors(cluster, cluster.cluster_centers_)
visualize = cv2.cvtColor(visualize, cv2.COLOR_RGB2BGR)
cv2.imshow('visualize', visualize)
cv2.waitKey()
【讨论】:
非常整洁!谢谢 我们如何聚类非黑色像素?【参考方案4】:如果您将图像放入 OpenCV 的 BGR 格式,则可以运行此代码,将每个像素放入四个分类之一:
蓝绿红灰
在下面的代码中,我们处理 Tonechas 使用的图像,
colored lego pieces
程序
import cv2 as cv
import numpy as np
from imageio import imread
image = imread('https://i.stack.imgur.com/DNM65.png')
img = cv.cvtColor(np.array(image), cv.COLOR_RGB2BGR)
rows, cols, _ = img.shape
color_B = 0
color_G = 0
color_R = 0
color_N = 0 # neutral/gray color
for i in range(rows):
for j in range(cols):
k = img[i,j]
if k[0] > k[1] and k[0] > k[2]:
color_B = color_B + 1
continue
if k[1] > k[0] and k[1] > k[2]:
color_G = color_G + 1
continue
if k[2] > k[0] and k[2] > k[1]:
color_R = color_R + 1
continue
color_N = color_N + 1
pix_total = rows * cols
print('Blue:', color_B/pix_total, 'Green:', color_G/pix_total, 'Red:', color_R/pix_total, 'Gray:', color_N/pix_total)
输出
Blue: 0.2978447577378059 Green: 0.21166979188369564 Red: 0.48950158575827024 Gray: 0.0009838646202282567
【讨论】:
以上是关于如何使用 OpenCV 在 Python 中找到图像的平均颜色?的主要内容,如果未能解决你的问题,请参考以下文章
如何使用 OpenCV 在 Python 中找到图像的平均颜色?
如何在openCV Python中选择统一着色图的特定部分?