Lua实现计算 UTF8 字符串的长度,每一个中文算一个字符

Posted heyuchang666

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Lua实现计算 UTF8 字符串的长度,每一个中文算一个字符相关的知识,希望对你有一定的参考价值。

-- 计算 UTF8 字符串的长度,每一个中文算一个字符
-- @function [parent=#string] utf8len
-- @param string input 输入字符串
-- @return integer#integer  长度

计算 UTF8 字符串的长度,每一个中文算一个字符

local input = "你好World"
print(string.utf8len(input))
-- 输出 7



function string.utf8len(input)
    local len  = string.len(input)
    local left = len
    local cnt  = 0
    local arr  = 0, 0xc0, 0xe0, 0xf0, 0xf8, 0xfc
    while left ~= 0 do
        local tmp = string.byte(input, -left)
        local i   = #arr
        while arr[i] do
            if tmp >= arr[i] then
                left = left - i
                break
            end
            i = i - 1
        end
        cnt = cnt + 1
    end
    return cnt
end

以上是关于Lua实现计算 UTF8 字符串的长度,每一个中文算一个字符的主要内容,如果未能解决你的问题,请参考以下文章

Lua 5.2 - utf8降低功能 - 是否有纯粹的lua实现?

在Lua中计算含中文的字符串的长度

Lua:具有特殊字符的String的字符串长度不正确

python 计算字符串长度

python 计算字符串长度

MySQL 中如何计算一个索引的长度