缩小 32 位 RGB 图像的最快算法
Posted
技术标签:
【中文标题】缩小 32 位 RGB 图像的最快算法【英文标题】:Fastest Algorithm to scale down 32Bit RGB IMAGE 【发布时间】:2010-12-16 07:05:44 【问题描述】:使用哪种算法将 32 位 RGB 图像按比例缩小到自定义分辨率?算法应该平均像素。
例如,如果我有 100x100 的图像并且我想要大小为 20x50 的新图像。第一个源行的前五个像素的平均值将给出目标的第一个像素,第一源列的前两个像素的平均值将给出第一个目标列的像素。
目前我所做的是首先缩小 X 分辨率,然后缩小 Y 分辨率。在这个方法中我需要一个临时缓冲区。
有没有你知道的优化方法?
【问题讨论】:
哪种方式?更少的比特或更少的像素?还是以其他方式? 【参考方案1】:您要查找的术语是“重采样”。在您的情况下,您需要图像重采样。您似乎已经在进行线性插值,这应该是最快的。这里有 6 种基本算法。如果您真的想深入研究该主题,请查看“重采样内核”。
Lanczos resampling Bicubic interpolation Bilinear interpolation Nearest-neighbor interpolation Spline interpolation Linear interpolation【讨论】:
【参考方案2】:在您进行标准 C 优化(指针算术、定点数学等...)之后 还有一些更聪明的优化。 (非常)很久以前,我看到了一个缩放器实现,它首先缩放了 X 方向。在写出水平缩放图像的过程中,它在内存中将图像旋转了 90 度。这样做是为了在读取 Y 方向刻度时,内存中的数据会更好地缓存对齐。
这种技术在很大程度上取决于它将运行的处理器。
【讨论】:
哇,非常好的技术,谢谢你的回答。【参考方案3】:这会平均适当的像素。
w_ratio = src.w / dest.w
h_ratio = src.h / dest.h
dest[x,y] =
AVG( src[x * w_ratio + xi, y * h_ratio + yi] )
where
xi in range (0, w_ratio - 1), inc by 1
yi in range (0, h_ratio - 1), inc by 1
对于边界条件,做一个单独的循环(没有 if's in loop)。
这是一个更像 C 的代码:
src 和 dest 是位图: * 像素属性 src[x,y] * 宽度的属性 src.w * 高度的属性 src.h
像素已被定义,因此
添加
p1 = p1 + p2
is same as
p1.r = p1.r + p2.r
p1.g = p1.g + p2.g
...
部门
p1 = p1 / c
p1.r = p1.r / c
p1.g = p1.g / c
用常数 0 计算
p1 = 0
p1.r = 0
p1.g = 0
...
为了简单起见,我不会考虑像素分量整数溢出时的问题...
float w_ratio = src.w / dest.w;
float h_ratio = src.h / dest.h;
int w_ratio_i = floor(w_ratio);
int h_ratio_i = floor(h_ratio);
wxh = w_ratio*h_ratio;
for (y = 0; y < dest.w; y++)
for (x = 0; x < dest.h; x++)
pixel temp = 0;
int srcx, srcy;
// we have to use here the floating point value w_ratio, h_ratio
// otherwise towards the end it can get a little wrong
// this multiplication can be optimized similarly to Bresenham's line
srcx = floor(x * w_ratio);
srcy = floor(y * h_ratio);
// here we use floored value otherwise it might overflow src bitmap
for(yi = 0; yi < h_ratio_i; yi++)
for(xi = 0; xi < w_ratio_i; xi++)
temp += src[srcx + xi, srcy + yi];
dest[x,y] = temp / wxh;
Bresenham's line optimization
【讨论】:
我无法理解你,但看起来你的方法很有希望。请问可以用c语言写吗?【参考方案4】:您忘记提及问题中最重要的方面:您对质量的关注程度。如果您不关心源像素的值是如何被拼凑在一起以创建目标像素的,那么最快(至少在几乎所有情况下)产生最差质量的像素。
如果您想以“仍然产生非常好的质量的最快算法”作为回应,那么您基本上已经涵盖了仅处理图像采样/调整大小的整个算法领域。
您已经概述了您对该算法的初步想法:
前五个像素的平均值 源行将给出第一个像素 目的地,
计算源像素上每个通道的平均值可能被视为微不足道,您是否正在寻找执行此操作的示例代码?
或者您是否正在寻找一个人来挑战您的算法初稿以更快的速度?
【讨论】:
我已经为我所描述的逻辑编写了代码。我想要更快的东西,在我目前的方法中,当我想在 x 和 y 中缩小图像时。我必须分开做。我首先在临时缓冲区中缩小 X 中的图像,然后从那个临时缓冲区中缩小 Y 中的图像。之后我得到了高质量的图像,但我不喜欢临时缓冲区的想法。我想要没有临时缓冲区的高质量stretchBlt,有什么方法吗?【参考方案5】:如果您正在寻找冗长的解释,我发现 this article 会很有帮助。另一方面,如果你更多地处理数学公式,有一种快速图像缩小的方法解释了here。
【讨论】:
【参考方案6】:这确实是速度/质量的权衡。
首先,你是正确的,做一个维度然后另一个维度比它必须的要慢。太多的内存读写。
您最大的选择是是否支持小数像素。您的示例是 100x100 到 20x50。所以 10 像素映射到 1。如果你要从 100x100 到 21x49 怎么办?您愿意在源像素边界处进行操作,还是想要将小数像素拉入? 100x100 到 99x99 你会怎么做?
您必须先告诉我们您愿意接受什么,然后我们才能说出什么是最快的。
并告诉我们收缩的可能极端情况。源和目的地之间的差异可能有多少个数量级?在某些时候,对源内的代表性像素进行采样不会比平均所有像素差多少。但是你必须小心选择有代表性的像素,否则你会得到许多常见模式的锯齿。
【讨论】:
【参考方案7】:你在做什么是优化的方法。唯一更快的称为最近邻,您只需抓住范围的中间像素而不尝试对其中任何一个进行平均。如果原始图像中有任何细节,则质量会明显变差,但如果原始图像简单,则可能可以接受。
【讨论】:
我第一次写了这个版本,但是当我用文字拉伸图像时,文字变得不可读,所以我用像素平均实现了新功能。但是带有像素平均值的stretchBlt 比普通的要多花300% 的时间。我已经为它编写了优化的程序集。我想要更快的质量,并希望消除我对临时缓冲区的需求。 不,他的方法不是最快的。他在做一个维度,然后是另一个维度。一次完成所有操作会更快,因为它的内存操作更少。 按照他的方式执行是 7 个内存操作,一次执行所有操作是 10 个。这是 O(n) 与 O(n^2),因此差异会随着收缩因子的增加而增加.以上是关于缩小 32 位 RGB 图像的最快算法的主要内容,如果未能解决你的问题,请参考以下文章