unicode转汉字

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了unicode转汉字相关的知识,希望对你有一定的参考价值。

function unicode_encode($name)
{
$name = iconv(‘UTF-8‘, ‘UCS-2‘, $name);
$len = strlen($name);
$str = ‘‘;
for ($i = 0; $i < $len - 1; $i = $i + 2)
{
$c = $name[$i];
$c2 = $name[$i + 1];
if (ord($c) > 0)
{    // 两个字节的文字
$str .= ‘\u‘.base_convert(ord($c), 10, 16).base_convert(ord($c2), 10, 16);
}
else
{
$str .= $c2;
}
}
return $str;
}

// 将UNICODE编码后的内容进行解码
function unicode_decode($name)
{
// 转换编码,将Unicode编码转换成可以浏览的utf-8编码
$pattern = ‘/([\w]+)|(\\\u([\w]{4}))/i‘;
preg_match_all($pattern, $name, $matches);
if (!empty($matches))
{
$name = ‘‘;
for ($j = 0; $j < count($matches[0]); $j++)
{
$str = $matches[0][$j];
if (strpos($str, ‘\\u‘) === 0)
{
$code = base_convert(substr($str, 2, 2), 16, 10);
$code2 = base_convert(substr($str, 4), 16, 10);
$c = chr($code).chr($code2);
$c = iconv(‘UCS-2‘, ‘UTF-8‘, $c);
$name .= $c;
}
else
{
$name .= $str;
}
}
}
return $name;
}

上方是php的2个函数,一个将汉字转成unicode,一个将unicode转为汉字。

工作中JSON.stringify(data);这个方法会将汉字转成unicode,但是在php中将unicode解析为汉字却失败了,于是研究发现,原来是unicode格式变了,正确的unicode格式是:\u5730\u65b9,汉字意思是‘地方’。但是在php反解析的时候这个unicode变成了u5730u65b9,没了那个斜杠。于是对于这样的情况改下格式就可以解析了,像这样:$name=unicode_decode(str_replace(‘u‘,‘\\u‘,‘u5730u65b9‘));这样就能正确解析了。

以上是关于unicode转汉字的主要内容,如果未能解决你的问题,请参考以下文章

unicode字符集与utf-8编码的区别,unicode转中文工具中文转unicode工具(汉字)

php 如何将unicode码转换成汉字

unicode编码转汉字

如何将unicode字符转换成汉字?

Unicode 转 汉字

unicode转汉字