如何快速计算任何底的整数对数?

Posted

技术标签:

【中文标题】如何快速计算任何底的整数对数?【英文标题】:How can you quickly compute the integer logarithm for any base? 【发布时间】:2020-12-04 05:46:23 【问题描述】:

如何快速计算任何底数的整数对数,而不仅仅是以 10 为底数? This question 有一个非常有效的 base 10 解决方案,但我想了解如何将其推广到其他基础。

【问题讨论】:

【参考方案1】:

基本原理

任何数字nlog_b(n) 的对数底数b 可以使用log(n) / log(b) 计算,其中log 是任何底数的对数(通常是自然对数)。 log(b) 是一个常数,所以如果我们可以有效地计算某个底的对数,我们就可以有效地计算 任何 底的对数。

不幸的是,这种转换只有在我们不丢弃数字的情况下才有可能。对于整数,我们只能快速计算底对数。例如,log_2(10) = 3。这将是 8 到 15 之间的任何数字的结果,尽管这些数字具有不同的小数位数。所以这个二进制对数可以帮助我们做出一个很好的猜测,但是我们需要完善这个猜测。

基数 10

上述问题有如下解决方案:

constexpr unsigned log2floor(uint64_t x) 
    // implementation for C++17 using clang or gcc
    return x ? 63 - __builtin_clzll(x) : 0;

    // implementation using the new C++20 <bit> header
    return x ? 63 - std::countl_zero(x) : 0;


constexpr unsigned log10floor(unsigned x) 
    constexpr unsigned char guesses[32] = 
        0, 0, 0, 0, 1, 1, 1, 2, 2, 2,
        3, 3, 3, 3, 4, 4, 4, 5, 5, 5,
        6, 6, 6, 6, 7, 7, 7, 8, 8, 8,
        9, 9
    ;
    constexpr uint64_t powers[11] = 
        1, 10, 100, 1000, 10000, 100000, 1000000,
        10000000, 100000000, 1000000000, 10000000000
    ;
    unsigned guess = guesses[log2floor(x)];
    return guess + (x >= powers[guess + 1]);

请注意,我必须进行一些修改,因为该解决方案实际上并非 100% 正确。

正如问题中所解释的,我们根据可以非常有效地计算的二进制对数进行猜测,然后在必要时增加我们的猜测。

猜测表可以使用:

index -> log_10(exp(2, index)) = log_10(1 << index)

您可以看到该表首先在索引4 处有一个1 条目,因为exp(2, 4) = 16 的下限log_101

示例

假设我们想知道log_10(15)

    我们计算log_2(15) = 3 我们查找log_10(exp(2, 3)) = log_10(8) = 0。这是我们最初的猜测。 我们查找exp(10, guess + 1) = exp(10, 1) = 1015 &gt;= 10,所以我们的猜测太低了,我们返回 guess + 1 = 0 + 1 = 1

任何基础的泛化

为了将这种方法推广到任何基础,我们必须在 constexpr 上下文中计算查找表。为了计算猜测表,我们首先需要一个简单的对数实现:

template <typename Uint>
constexpr Uint logFloor_naive(Uint val, unsigned base)  
    Uint result = 0;
    while (val /= base) 
        ++result;
    
    return result;

现在,我们可以计算查找表了:

#include <limits>
#include <array>

template <typename Uint, size_t BASE>
constexpr std::array<uint8_t, std::numeric_limits<Uint>::digits> makeGuessTable()

    decltype(makeGuessTable<Uint, BASE>()) result;
    for (size_t i = 0; i < result.size(); ++i) 
        Uint pow2 = static_cast<Uint>(Uint1 << i);
        result.data[i] = logFloor_naive(pow2, BASE);
    
    return result;


// The maximum possible exponent for a given base that can still be represented
// by a given integer type.
// Example: maxExp<uint8_t, 10> = 2, because 10^2 is representable by an 8-bit unsigned
// integer but 10^3 isn't.
template <typename Uint, unsigned BASE>
constexpr Uint maxExp = logFloor_naive<Uint>(static_cast<Uint>(~Uint0u), BASE);

// the size of the table is maxPow<Uint, BASE> + 2 because we need to store the maximum power
// +1 because we need to contain it, we are dealing with a size, not an index
// +1 again because for narrow integers, we access guess+1
template <typename Uint, size_t BASE>
constexpr std::array<uint64_t, maxExp<Uint, BASE> + 2> makePowerTable()

    decltype(makePowerTable<Uint, BASE>()) result;
    uint64_t x = 1;
    for (size_t i = 0; i < result.size(); ++i, x *= BASE) 
        result.data[i] = x;
    
    return result;

请注意,我们需要maxExp 模板化常量来确定第二个查找表的大小。最后,我们可以使用查找表来得出最终函数:

// If our base is a power of 2, we can convert between the
// logarithms of different bases without losing any precision.
constexpr bool isPow2or0(uint64_t val) 
    return (val & (val - 1)) == 0;


template <size_t BASE = 10, typename Uint>
constexpr Uint logFloor(Uint val) 
    if constexpr (isPow2or0(BASE)) 
        return log2floor(val) / log2floor(BASE);
    
    else 
        constexpr auto guesses = makeGuessTable<Uint, BASE>();
        constexpr auto powers = makePowerTable<Uint, BASE>();

        uint8_t guess = guesses[log2floor(val)];
        
        // Accessing guess + 1 isn't always safe for 64-bit integers.
        // This is why we need this condition. See below for more details.
        if constexpr (sizeof(Uint) < sizeof(uint64_t)
            || guesses.back() + 2 < powers.size()) 
            return guess + (val >= powers[guess + 1]);
        
        else 
            return guess + (val / BASE >= powers[guess]);
        
    

powers 查找表的注意事项

我们总是将uint64_t 用于powers 表的原因是我们访问guess + 1exp(10, guess + 1) 并不总是可表示的。例如,如果我们使用 8 位整数并猜测 2,那么 exp(10, guess + 1) 将是 1000,这是无法使用 8 位整数表示的。

通常,这会导致 64 位整数出现问题,因为没有更大的整数类型可用。但也有例外。例如,可表示的 2 的最大幂 exp(2, 63) 低于 10 的最大可表示幂 exp(10, 19)。这意味着最高猜测将是 18exp(10, guess + 1) = exp(10, 19) 是可表示的。因此,我们始终可以安全地访问powers[guess + 1]

这些异常非常有用,因为我们可以避免在这种情况下进行整数除法。如上所示,可以通过以下方式检测此类异常:

guesses.back() + 2 < powers.size()

【讨论】:

除了__builtin_clzll,您还可以使用&lt;bit&gt; (C++20) 中的函数:countl_zerobit_width 在 MSVC 中,您可以在 __lzcnt64 中使用类似的内在函数(假设您的 cpu 支持 LZCNT 指令)

以上是关于如何快速计算任何底的整数对数?的主要内容,如果未能解决你的问题,请参考以下文章

C中任意整数基数的对数函数

BigDecimal 的对数

log对数运算符号是啥意思?

计算一个整数(N)的阶乘的位数

在 Basic 中计算自己的对数(LibreOffice Calc Macro)

数学 - 概念回顾