连续截断整数除法可以用乘法代替吗?

Posted

技术标签:

【中文标题】连续截断整数除法可以用乘法代替吗?【英文标题】:Can consecutive truncating integer divisions be replaced with a multiplication? 【发布时间】:2019-01-20 19:19:55 【问题描述】:

在有理数的小学数学中,表达式(a / b) / c 通过基本代数运算等效于a / (b * c)

/ 在 C 和大多数其他语言中截断整数除法时是否也是如此?也就是所有除数的乘积可以用一个除数代替一系列除数吗?

你可以假设乘法不会溢出(如果溢出,很明显它们不等价)。

【问题讨论】:

编程语言不会改变数学规则。 @old_timer - 我不确定你的意思。数学规则取决于操作的语义。我在学校学到的规则通常适用于实数或有理数,而不适用于“截断除法” - 所以并不完全清楚哪些适用(当然有些不适用,例如a / b * b == a)。因此,如果您愿意,您可以将此问题解释为关于用 C 实现的特定类型的数学。还要考虑大多数“数学”规则根本不适用于浮点数学(我不是在这里问)。 100 / 2 / 5 = 10. 100 / (2*5) = 10;只要你没有分数,这在纸上和编程语言中都是正确的。如果你限制为整数,你在数学上遇到的一个问题是分数,但事实上除法有效,在你插入数字之前它仍然有效 Apparently, it is equivalent ... 但不要将此评论视为真相。请参阅 John Coleman 的回答。 @chqrlie - 关于INT_MIN-1 的好点虽然至少在这种情况下UB 是在“正确的方向” - 也就是说,转换版本是定义的,而原始版本不是'吨。所以转换至少在那个问题上是“安全的”:毕竟,如果原始形式是 UB,你就不能真正期待任何特别是转换后的版本(如果你对反向转换感兴趣,那当然是一个问题) . 【参考方案1】:

答案是“是”(至少对于非负整数)。这来自division algorithm,它指出对于任何正整数a,d,对于唯一的非负整数q,r0 <= q <= d-1,我们都有a = dq+r。在这种情况下,q a/d 在整数除法中。

a/b/c(带整数除法)中,我们可以分两步思考:

a = b*q_1 + r_1  // here q_1 = a/b and 0 <= r_1 <= b-1
q_1 = c*q_2 + r_2 // here q_2 = q_1/c = a/b/c and 0 <= r_2 <= c-1

然后

a = b*q_1 + r_1 = b*(c*q_2 + r_2) + r_1 = (b*c)*q_2 + b*r_2 + r1

注意0 &lt;= b*r_2 + r_1 &lt;= b*(c-1) + b-1 = bc - 1

由此得出q_2a/(b*c)。因此a/b/c = a/(b*c)

【讨论】:

谢谢,这是我正在寻找的证据。对于负数,假设 一致 向 0 舍入或向 -infinity 舍入,类似的情况是否成立?【参考方案2】:

是的,在整数上。有人已经发布(并删除了?)一个示例,说明它可能无法在浮点上运行。 (不过,对于您的应用程序来说,它可能已经足够接近了。)

@JohnColeman 有一个理论论证,但这里有一个实验论证。如果你运行这段代码:

#include <stdio.h>
#include <stdlib.h>
#include <limits.h>

#define LIMIT 100
#define NUM_LIMIT 2000

int main() 
    for(int div1 = -LIMIT; div1 < LIMIT; div1++) 
        for(int div2 = -LIMIT; div2 < LIMIT; div2++) 
            if(div1 == 0 || div2 == 0) continue;
            for(int numerator = -NUM_LIMIT; numerator < NUM_LIMIT; numerator++) 
                int a = (numerator / div1) / div2;
                int b = numerator / (div1 * div2);
                if(a != b) 
                    printf("%d %d\n", a, b);
                    exit(1);
                
            
        
    
    return 0;

它尝试两种方式的除法,如果它们不同,则报告错误。按以下方式运行不会报错:

div1、div2 从 -5 到 5,分子从 -INT_MAX/100 到 INT_MAX/100 div1,div2 从 -2000 到 2000,分子从 -2000 到 2000

因此,我敢打赌这适用于任何整数。 (再次假设 div1*div2 没有溢出。)

【讨论】:

我敢打赌这适用于任何整数几乎不能作为证明。 我还使用了“尝试一些数字”的方法,无论是在我的脑海中还是在上面的程序中。问题是我不认为它是确定的,除非你能做到详尽无遗。 也许对于 16 位数字是可行的(如果您可以将每次检查的时间降低到 1 ns,则需要几天时间来搜索 48 位空间),但即使是 32 位数字也不是吨。另外,我猜 C 对除法有 impl-defined 行为,所以你冒着让它在你的机器上工作的风险,但并不总是符合标准。【参考方案3】:

通过实验查看这个有助于了解您如何应用数学。

软件不会改变数学、身份或您使用变量来简化或更改方程的其他操作。软件执行要求的操作。除非您溢出,否则定点可以完美地完成它们。

根据数学而不是软件,我们知道 b 或 c 都不能为零以使其起作用。软件补充的是 b*c 也不能为零。如果溢出则结果是错误的。

a / b / c = (a/b) * (1/c) = (a*1) / (bc) = a / (bc) 从小学和你可以在您的编程语言中实现 a/b/c 或 a/(b*c),这是您的选择。大多数情况下,如果您坚持使用整数,则由于未表示分数,结果是不正确的。如果您使用浮点数,结果相当多的时候是不正确的,同样的原因,没有足够的位来存储无限大或小的数字,就像纯数学的情况一样。那么你在哪里遇到这些限制呢?您可以通过一个简单的实验开始看到这一点。

编写一个程序,遍历 a、b 和 c 的 0 到 15 之间所有可能的数字组合,计算 a/b/c 和 a/(b*c) 并比较它们。由于这些是四位数字,因此如果您想查看编程语言将如何处理,请记住中间值不能超过 4 位。仅打印除以零和不匹配的除数。

您会立即看到,允许任何值为零会导致一个非常无趣的实验,您要么得到很多除以零,要么 0/something_not_zero 不是一个有趣的结果。

 1  2  8 : divide by zero
 1  3 11 :  1  0
 1  4  4 : divide by zero
 1  4  8 : divide by zero
 1  4 12 : divide by zero
 1  5 13 :  1  0
 1  6  8 : divide by zero
 1  7  7 :  1  0
 1  8  2 : divide by zero
 1  8  4 : divide by zero
 1  8  6 : divide by zero
 1  8  8 : divide by zero
 1  8 10 : divide by zero
 1  8 12 : divide by zero
 1  8 14 : divide by zero
 1  9  9 :  1  0
 1 10  8 : divide by zero
 1 11  3 :  1  0
 1 12  4 : divide by zero
 1 12  8 : divide by zero
 1 12 12 : divide by zero
 1 13  5 :  1  0
 1 14  8 : divide by zero
 1 15 15 :  1  0
 2  2  8 : divide by zero
 2  2  9 :  1  0
 2  3  6 :  1  0
 2  3 11 :  2  0

所以到目前为止,答案是匹配的。对于有意义的小 a 或特别是 a=1,结果要么是 0 要么是 1。两条路径都会让你到达那里。

 1  2  8 : divide by zero

至少对于 a=1,b=1。 c=1 为 1,其余为 0。

2*8 = 16 或 0x10 位太多,因此会溢出,结果是 0x0 除以零,因此无论是浮点数还是定点数,您都必须查找。

 1  3 11 :  1  0

第一个有趣的 1 / (3*11) = 1 / 0x21 表示 1/1 = 1; 1 / 3 = 0, 0 / 11 = 0。 所以他们不匹配。 3*11 溢出。

这样下去。

所以将 ra 设为更大的数字可能会使这更有趣?无论如何,一个小的 a 变量大部分时间都会使结果为 0。

15  2  8 : divide by zero
15  2  9 :  7  0
15  2 10 :  3  0
15  2 11 :  2  0
15  2 12 :  1  0
15  2 13 :  1  0
15  2 14 :  1  0
15  2 15 :  1  0
15  3  6 :  7  0
15  3  7 :  3  0
15  3  8 :  1  0
15  3  9 :  1  0
15  3 10 :  1  0
15  3 11 : 15  0
15  3 12 :  3  0
15  3 13 :  2  0
15  3 14 :  1  0
15  3 15 :  1  0
15  4  4 : divide by zero
15  4  5 :  3  0
15  4  6 :  1  0
15  4  7 :  1  0
15  4  8 : divide by zero
15  4  9 :  3  0


15  2  9 :  7  0

15 / (2 * 9) = 15 / 0x12 = 15 / 2 = 7。 15 / 2 = 7; 7 / 9 = 0;

15  3 10 :  1  0
15  3 11 : 15  0

这两种情况都溢出没意思。

所以改变你的程序,只显示结果不匹配的那些,但也没有 b*c 溢出......没有输出。使用 4 位值与 8 位与 128 位执行此操作之间没有任何魔法或区别……它只是让您获得更多可能有效的结果。

0xF * 0xF = 0xE1,你可以很容易地看到它在二进制中进行长乘法,最坏的情况是覆盖所有可能的 N 位值,你需要 2*N 位来存储结果而不会溢出。因此,对于除法来说,一个由 N/2 位数分母限制的 N 位分子可以覆盖每个具有 N 位结果的所有定点值。 0xFFFF / 0xFF = 0x101。 0xFFFF / 0x01 = 0xFFFF。

因此,如果您想进行此数学运算并且可以确保没有一个数字超过 N 位,那么如果您使用 N*2 位进行数学运算。您不会有任何乘法溢出,您仍然需要担心除以零。

为了通过实验证明这一点,请尝试从 a、b、c 的 0 到 15 的所有组合,但使用 8 位变量而不是 4 位变量进行数学运算(在每次除法之前检查是否除以零并将这些组合丢弃)并且结果总是匹配。

那么有没有“更好”的?乘法和除法都可以使用大量逻辑在单个时钟中实现,或者使用指数减少的多个时钟实现,尽管您的处理器文档说它是单个时钟它可能仍然是多个时钟,因为有管道并且它们可以隐藏 2 或4个循环进入一些管道并节省大量芯片房地产。或者一些处理器根本不做划分以节省空间。一些来自 arm 的 cortex-m 内核可以编译为单时钟或多时钟除法,仅在有人进行乘法时才会受到伤害(谁在他们的代码中进行乘法???或除法???)。当你做类似的事情时,你会看到

x = x / 5;

取决于目标和编译器以及可以/将要实现为 x = x * (1/5) 的优化设置以及使其工作的其他一些动作。

unsigned int fun ( unsigned int x )

    return(x/5);


0000000000000000 <fun>:
   0:   89 f8                   mov    %edi,%eax
   2:   ba cd cc cc cc          mov    $0xcccccccd,%edx
   7:   f7 e2                   mul    %edx
   9:   89 d0                   mov    %edx,%eax
   b:   c1 e8 02                shr    $0x2,%eax
   e:   c3                      retq   

除法和乘法一样可用,但乘法被认为更好,可能是因为时钟,也可能是其他原因。

所以您可能希望考虑到这一点。

如果执行 a/b/c,则必须检查除以零两次,但如果执行 a / (b+c),则只需检查一次。对于每条 alu 指令的 1 个或接近 1 个时钟数,检查除以零的成本比数学本身更高。因此,乘法在理想情况下表现更好,但也有可能例外。

您可以使用带符号的数字重复所有这些操作。这同样适用。如果它适用于 4 位,它将适用于 8 和 16 以及 32 和 64 和 128 等等......

7 * 7 = 0x31
-8 * -8 = 0x40
7 * -8 = 0xC8

这应该涵盖极端情况,因此如果您使用的位数是最坏情况的两倍,则不会溢出。您仍然必须在每次除法之前检查除以零,因此乘法解决方案仅导致一次检查零。如果将所需位数加倍,则不必检查乘法是否溢出。

这里没有魔法,这一切都是用基础数学解决的。我什么时候溢出,使用铅笔和纸并且没有编程语言(或者像我那样使用计算器以使其更快)你可以看到什么时候。您还可以使用更多的小学数学。 N 位的 b 的 msbit 是 b[n-1] * 2^(n-1) 对吗?使用 4 位数,无符号,msbit 为 0x8,即 1 * 2^(4-1);其余的 b (b[3] * 2^3) + (b[2] * 2^2) + (b[1] * 2^1) + (b[0] * 2^ 0); C 也一样,所以当我们使用小学数学将它们相乘时,如果你坐下来工作,我们会从 (b[3]c[3])(2^(3+3)) 开始最坏的情况不能超过 2^8。也可以这样看:

     abcd
*    1111
=========
     abcd
    abcd
   abcd
+ abcd
=========
  xxxxxxx

7 位加上进位的可能性,使其总共 8 位。所有简单的小学数学,看看潜在的问题是什么。

实验将不会显示失败的位模式(除以零不算数,这对于 a/b/c = a/(b*c) 也不起作用)。 John Colemans 从另一个角度回答可能有助于感觉所有位模式都可以工作。尽管那都是正数。只要您检查所有溢出,这也适用于负数。

【讨论】:

请注意,如果您想添加舍入,那么以 2 为底很容易,您只需将数字设为两倍大小 (((a>1;但是现在您必须再次注意溢出...或者是吗?

以上是关于连续截断整数除法可以用乘法代替吗?的主要内容,如果未能解决你的问题,请参考以下文章

如何使用位移来代替整数除法?

js 后端返回浮点数,前端用乘法或者除法处理,得到超常值

关于fpga的除法

舍入整数除法(而不是截断)

定位因整数除法导致的数值错误

[python]运算符与表达式