如何在 Erlang 中找到 utf8 编码二进制文件的字符长度?

Posted

技术标签:

【中文标题】如何在 Erlang 中找到 utf8 编码二进制文件的字符长度?【英文标题】:How do I find the characters length of a utf8 encoded binary in Erlang? 【发布时间】:2021-11-29 10:50:59 【问题描述】:

如何在 Erlang 中找到 utf8 编码的二进制文件的字符长度?

【问题讨论】:

你能说得更具体些吗? Erlang 中的二进制文件是字节序列。您是在问如何查找二进制文件中的字节数,或者如果二进制文件被解释为 UTF8 字符串,如何查找字符数?您转换为列表的解决方案提供了前者。 @WojtekSurowka 抱歉我的错误,我的意思是查找字符数,而不是字节数。 【参考方案1】:

使用函数string:length,它——在其他字符串表示中——接受带有UTF8编码字符串的二进制作为其参数并返回字符数。

【讨论】:

谢谢。我需要更多地关注文档。 :)

以上是关于如何在 Erlang 中找到 utf8 编码二进制文件的字符长度?的主要内容,如果未能解决你的问题,请参考以下文章

MySQL_编码utf8_bin和utf8_general_ci的区别

一句话理解字符编码(Unicode ,UTF8,UTF16)

mysql中utf8编码的utf8_bin,utf8_general_cs,utf8_bin的区别

建库和建表中编码问题

javascript 字符串进行 utf8 编码的方法(转)

彻底搞懂编码 GBK 和 UTF8