php - 如何将 unicode 转换为 utf-8 字符串

Posted

技术标签:

【中文标题】php - 如何将 unicode 转换为 utf-8 字符串【英文标题】:php - how to convert unicode to utf-8 string 【发布时间】:2021-07-06 04:21:09 【问题描述】:

我有一个这样的字符串:

%d8%b7%d8%b1%d8%a7%d8%ad%db%8c-%d8%a7%d9%be%d9%84%db%8c%da%a9%db%8c%d8%b4%d9%86-%d9%81%d8%b1%d9%88%d8%b4%da%af%d8%a7%d9%87%db%8c

页面的meta标签设置为utf-8

<meta http-equiv="Content-Type" content="text/html; charset=utf-8"/>

我想将此 unicode 转换为纯可读的 utf-8 字符串

我测试了很多代码,这是我的最后一个代码:

 function convertFarsi($str) 
        return html_entity_decode(preg_replace('/\\\\u([a-f0-9]4)/i', '&#x$1;', $str),ENT_QUOTES, 'UTF-8');
    

它不起作用。 如何将这些 un​​icode 转换为 utf8 字符串?

【问题讨论】:

您希望最终结果是什么? 【参考方案1】:

你可以使用url_decode得到如下结果:

    <?php
    
    $string = '%d8%b7%d8%b1%d8%a7%d8%ad%db%8c-%d8%a7%d9%be%d9%84%db%8c%da%a9%db%8c%d8%b4%d9%86-%d9%81%d8%b1%d9%88%d8%b4%da%af%d8%a7%d9%87%db%8c';
    
    $outpout = urldecode($string);
    
    echo $outpout; // طراحی-اپلیکیشن-فروشگاهی

【讨论】:

【参考方案2】:

此函数不解码 unicode 字符。我写了一个函数。

function unicode_urldecode($url)

    preg_match_all('/%u([[:alnum:]]4)/', $url, $a);
   
    foreach ($a[1] as $uniord)
    
        $dec = hexdec($uniord);
        $utf = '';
       
        if ($dec < 128)
        
            $utf = chr($dec);
        
        else if ($dec < 2048)
        
            $utf = chr(192 + (($dec - ($dec % 64)) / 64));
            $utf .= chr(128 + ($dec % 64));
        
        else
        
            $utf = chr(224 + (($dec - ($dec % 4096)) / 4096));
            $utf .= chr(128 + ((($dec % 4096) - ($dec % 64)) / 64));
            $utf .= chr(128 + ($dec % 64));
        
       
        $url = str_replace('%u'.$uniord, $utf, $url);
    
   
    return urldecode($url);

Source Demo

【讨论】:

【参考方案3】:

这似乎可以做到:

<?php
$s = '%d8%b7%d8%b1%d8%a7%d8%ad%db%8c-%d8%a7%d9%be%d9%84%db%8c%da%a9%db%8c%d8%b4%d9%86-%d9%81%d8%b1%d9%88%d8%b4%da%af%d8%a7%d9%87%db%8c';
$t = urldecode($s);
var_dump($t == 'طراحی-اپلیکیشن-فروشگاهی');

https://php.net/function.urldecode

【讨论】:

以上是关于php - 如何将 unicode 转换为 utf-8 字符串的主要内容,如果未能解决你的问题,请参考以下文章

将 ASCII 转换为 UTF-8 编码

如何将4字节utf-8的emoji表情转换为unicode字符编码

将 UTF8 表上的 latin1 字符转换为 UTF8

如何将汉字转换为iso-8859-1的字符串 - PHP进阶讨论

PHP操作CSV文件的编码问题

如何在 mysql 或 php 中将 'u00e9' 转换为 utf8 字符?