3.6.6 码点与代码单元
Posted avention
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了3.6.6 码点与代码单元相关的知识,希望对你有一定的参考价值。
Java字符串由char值序列组成。char数据类型是一个采用UTF-16编码表示Unicode码点的代码单元。大多数的常用Unicode字符使用一个代码单元就可以表示,而辅助字符需要一对代码单元表示。
length方法返回采用UTF-16编码表示的给定字符串所需要的代码单元数量。例如:
String greeting = "Hello";
int n = greeting.length();
要想得到实际的长度,即码点数量,可以调用:
int cpCount = greeting.codePointCount(0, greeting.length());
调用s.charAt(n)将返回位置n的代码单元,n介于 0 ~ s.length() - 1之间。
要想得到第i个码点,应该使用下列语句
int index = greeting.offsetByCodePoints(0,i);
int cp = greeting.codePointAt(index);
以上是关于3.6.6 码点与代码单元的主要内容,如果未能解决你的问题,请参考以下文章