如何将 RGB 或 HEX 颜色代码分组为更大的颜色组?
【中文标题】如何将 RGB 或 HEX 颜色代码分组为更大的颜色组?【英文标题】:How to group RGB or HEX color codes to bigger sets of color groups? 【发布时间】:2021-01-07 15:59:40 【问题描述】:我正在分析大量图像并提取主要颜色代码。
我建议您检查图像在 RGB 颜色空间中的直方图,查看每个通道后,您可以得出图像颜色的结论。 Histogram of an image 【参考方案1】:在机器学习领域,您要做的称为classification,其目标是将其中一个类(颜色)的标签分配给每个观察值(图像)。 为此,必须预先定义类。假设这些是我们要分配给图像的颜色:
要确定图像的主色,必须计算其每个像素与表中所有颜色之间的距离。请注意,此距离是在 RGB 颜色空间中计算的。要计算图像的第 ij 个像素点与表格的第 k 个颜色之间的距离,可以使用以下等式:
d_ijk = sqrt((r_ij-r_k)^2+(g_ij-g_k)^2+(b_ij-b_k)^2)
在下一步中,对于每个像素,选择表中最接近的颜色。这是用于使用indexed colors 压缩图像的概念(除了这里的调色板对于所有图像都是相同的,并且不会为每个图像计算以最小化原始图像和索引图像之间的差异)。现在,正如@jairoar 指出的那样,我们可以获得图像的直方图(不要与 RGB 直方图或强度直方图混淆),并确定重复次数最多的颜色。 为了展示这些步骤的结果,我使用了这件艺术品的随机裁剪!我的:
这是索引前后图像的外观(左:原始,右:索引): 这些是最重复的颜色(左:索引,右:主色):
但既然你说图像数量很大,你应该知道这些计算是比较耗时的。但好消息是有一些方法可以提高性能。例如,您可以使用City Block 或Chebyshev 距离,而不是使用Euclidean distance(上面的公式)。您也可以只计算一小部分像素的距离,而不是计算图像中所有像素的距离。为此,您可以先将图像缩放到更小的尺寸(例如,32 x 32),然后对该缩小图像的像素执行计算。如果您决定调整图像大小,不要费心使用双线性或双三次插值,这不值得额外计算。取而代之的是nearest neighbor,它实际上对原始图像执行rectangular lattice 采样。
虽然上面提到的变化会大大提高计算速度,但没有什么好东西是免费的。这是性能与准确性的权衡。例如,在前面两张图片中,我们看到最初被识别为橙色(代码 20)的图像在调整大小后已被识别为粉红色(代码 26)。 要确定算法的参数(距离测量、缩小图像大小和缩放算法),您必须首先以尽可能高的精度对多个图像进行分类操作,并将结果作为基本事实。然后,通过多次实验,得到不使分类误差超过最大容许值的参数组合。
我明白了,所以您可以使用颜色量化 (en.wikipedia.org/wiki/Color_quantization) 来减少图像信息,然后使用欧几里德距离将颜色与预定义列表进行匹配 @GeorgeKaf 如果“减少图像信息”只是指调整图像大小,那么可以。如您链接的页面中所述,“大多数标准技术将颜色量化视为三维空间中聚类点的问题”。我建议将其视为分类问题。我们不需要知道“RGB 空间”中的哪些颜色最能描述图像,相反,我们有兴趣找到“预定义调色板”中的哪些颜色最能描述图像。重点是,当调色板已知时,我们可以省略聚类阶段。 @GeorgeKaf 如果您没有调色板,您可以对样本数据集执行两个聚类步骤来获取它。首先对集合中的每个图像进行颜色量化并存储其所有调色板,然后将所有调色板中的所有颜色再次聚类以获得单个调色板。【参考方案2】:@saastn 的绝妙答案假设您有一组预定义的颜色,您希望将图像分类到这些颜色。如果您只是想将图像分类为一组 X 等距颜色中的一种颜色(即直方图),则实施会更容易。
这是我在 Python 中的实现:
import cv2
import numpy as np
#Set this to the number of colors that you want to classify the images to
number_of_colors = 8
#Verify that the number of colors chosen is between the minimum possible and maximum possible for an RGB image.
assert 8 <= number_of_colors <= 16777216
#Get the cube root of the number of colors to determine how many bins to split each channel into.
number_of_values_per_channel = number_of_colors ** ( 1 / 3 )
#We will divide each pixel by its maximum value divided by the number of bins we want to divide the values into (minus one for the zero bin).
divisor = 255 / (number_of_values_per_channel - 1)
#load the image and convert it to float32 for greater precision. cv2 loads the image in BGR (as opposed to RGB) format.
image = cv2.imread("image.png", cv2.IMREAD_COLOR).astype(np.float32)
#Divide each pixel by the divisor defined above, round to the nearest bin, then convert float32 back to uint8.
image = np.round(image / divisor).astype(np.uint8)
#Flatten the columns and rows into just one column per channel so that it will be easier to compare the columns across the channels.
image = image.reshape(-1, image.shape[2])
#Find and count matching rows (pixels), where each row consists of three values spread across three channels (Blue column, Red column, Green column).
uniques = np.unique(image, axis=0, return_counts=True)
#The first of the two arrays returned by np.unique is an array compromising all of the unique colors.
colors = uniques[0]
#The second of the two arrays returend by np.unique is an array compromising the counts of all of the unique colors.
color_counts = uniques[1]
#Get the index of the color with the greatest frequency
most_common_color_index = np.argmax(color_counts)
#Get the color that was the most common
most_common_color = colors[most_common_color_index]
#Multiply the channel values by the divisor to return the values to a range between 0 and 255
most_common_color = most_common_color * divisor
#If you want to name each color, you could also provide a list sorted from lowest to highest BGR values comprising of
#the name of each possible color, and then use most_common_color_index to retrieve the name.
来获取实际的number_of_colors ?
number_of_colors 将是您要将图像分类到的颜色类别的数量。这是一个你会决定的数字。例如,如果您想将图像分类为以下 8 个类别:[“黑色”、“红色”、“绿色”、“蓝色”、“青色”、“紫色”、“黄色”、“白色”],您将输入 8。
PIL 用于计算直方图的 getcolors() 函数仅适用于黑白图像,并且不允许您设置 bin 的数量。 CV2 的直方图功能可让您设置 bin 的数量,但不允许您使用彩色图像。使用 CV2,您必须拆分通道,然后组合生成的直方图,这似乎比我做的更难实现。在某个库中的某个地方应该有一个函数可以完成我所做的事情,但我不知道。我还担心过度依赖库会导致难以用另一种语言实现。以上是关于如何将 RGB 或 HEX 颜色代码分组为更大的颜色组?的主要内容,如果未能解决你的问题,请参考以下文章
Sass/Compass - 将 Hex、RGB 或命名颜色转换为 RGBA