PHP CURL 没有正确处理编码的返回数据

Posted

技术标签:

【中文标题】PHP CURL 没有正确处理编码的返回数据【英文标题】:PHP CURL isn't processing encoded return data properly 【发布时间】:2013-09-22 18:32:30 【问题描述】:

我有一些小的编码问题。我从这里得到一个 json 数据字符串(自己试试):

http://cdn.content.easports.com/fifa/fltOnlineAssets/C74DDF38-0B11-49b0-B199-2E2A11D1CC13/2014/fut/items/web/179899.json

数据中的名字是这样显示的

Ari Skúlason

我怎样才能以正确的编码获取这些数据,以便它的 Ari Skúlason?

我尝试在 php 中像这样将其切换为 utf-8

echo mb_convert_encoding($r,'ISO-8859-1','utf-8');

这让我更接近,但它仍然不对

Ari Sk�lason

我的 php curl 请求:

$location = 'http://cdn.content.easports.com/fifa/fltOnlineAssets/C74DDF38-0B11-49b0-  B199-2E2A11D1CC13/2014/fut/items/web/179899.json';
$ch = curl_init($location);
curl_setopt($ch, CURLOPT_HEADER, false);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_HTTPHEADER, array(                                                                                                                                                        
'Accept: application/json'));
$r = curl_exec($ch);
curl_close($ch);
echo mb_detect_encoding($r);
$r = mb_convert_encoding($r,'ISO-8859-1','utf-8');

print_r($r);

【问题讨论】:

您是否可以控制您正在使用的网址?您可以在那里更改编码 【参考方案1】:

CURLOPT_ENCODING 设置另一个 curl 选项并将其设置为 "" 以确保它不会返回任何垃圾

   curl_setopt($ch, CURLOPT_ENCODING ,"");

【讨论】:

【参考方案2】:

你可以使用标题

   header('Content-type: text/html; charset=UTF-8');

解码后的字符串

 $page = utf8_decode(curl_exec($ch));

它对我有用

curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_ENCODING, 'UTF-8');
curl_setopt($ch,CURLOPT_USERAGENT,'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.13) Gecko/20080311 Firefox/2.0.0.13');

添加后

$page = curl_exec($ch);
$dom = new DOMDocument('1.0', 'utf-8');
libxml_use_internal_errors(true);
@$dom->loadHTML(mb_convert_encoding($page, 'HTML-ENTITIES', 'UTF-8'));

【讨论】:

无论它是否有效,UTF-8 都不是 CURLOPT_ENCODING 的有效参数。这指定了Accept-Encoding Field,与字符编码无关。有效参数为:identity、gzip、deflate 和 ""。 当来自 CURL 或浏览器的请求时,我对同一个 URL 有不同的响应。非常感谢您让我了解 CURLOPT_USERAGENT ......现在它在两者中都可以正常工作:)【参考方案3】:

你也可以试试。

...

$results = curl_exec($init);
curl_close($init);
return json_decode(utf8_encode($results));

utf8_encode 编码的 ASCII 字符。返回非编码 ASCII 可能会中断或返回错误(以我为例)。

【讨论】:

【参考方案4】:

你可以试试

$res= curl_exec ( $ch ); 
$result = iconv("Windows-1251", "UTF-8", $res);

【讨论】:

以上是关于PHP CURL 没有正确处理编码的返回数据的主要内容,如果未能解决你的问题,请参考以下文章

php curl 在本地 XAMPP 上返回空字符串,但是相同的代码在生产服务器上返回正确的字符串

PHP模拟POST提交数据并获得返回值之CURL方法(使用PHP extension,然后使用php_curl.dll,很不错)

PHP curl_multi_close函数

php中 curl模拟post发送json并接收json(转)

从 PHP Web 服务未正确返回编码响应

PHP curl_multi_add_handle函数