无法通过 PDO_ODBC 从 Access 检索 UTF-8 重音字符

Posted

技术标签:

【中文标题】无法通过 PDO_ODBC 从 Access 检索 UTF-8 重音字符【英文标题】:Unable to retrieve UTF-8 accented characters from Access via PDO_ODBC 【发布时间】:2015-04-03 09:40:12 【问题描述】:

我正在尝试将 Access DB 转换为 mysql。一切正常,期待一个大猴子扳手......如果访问数据库有任何非标准字符,它将无法工作。我的查询会告诉我:

Incorrect string value: '\xE9d'

如果我直接回显包含“无效”字符的行文本,我会在浏览器中的黑色方块中看到一个问号(因此 é 在回显时会变成无效的符号)。

注意:同样的 from 将接受、保存并在用于标题此数据库上传的文本框中显示“é”罚款。此外,如果我“另存为”页面并重新打开它,“é”会正确显示....

这是我的连接方式:

$conn = new PDO("odbc:Driver=Microsoft Access Driver (*.mdb);Dbq=$fileLocation;SystemDB=$securefilePath;Uid=developer;Pwd=pass;charset=utf;");

我尝试了很多方法,包括:

$conn -> exec("set names utf8");

当我尝试访问“CurrentDb.Collat​​ingOrder”时,它告诉我 1033 显然是“英语、德语、法语和葡萄牙语整理顺序”的 dbSortGeneral。

怎么了?这几乎就像 PDO 向我发送了我的浏览器和 php 不完全理解的排序规则。

【问题讨论】:

我使用 mssql、mysql、utf8 和 latin1 解决了很多编码问题。如果您提供更多代码,我可以尝试帮助您。例如,我不明白错误Incorrect string value: '\xE9d' 究竟出现在哪里。所以请 - 更多代码! 您是否尝试对从 Access 数据库中检索到的字符串使用 utf8_encode() 函数?这可能有效,前提是您要检索的重音字符以 ISO-8859-1 字符集表示(如 é 是)。 Gord Thompson:谢谢,这行得通(明天将进行更多测试)。根据谷歌搜索,“ISO-8859-1”支持为 1033 列出的 4 种语言。所以希望这可以解决所有情况下的所有问题......不确定如何将您的帖子标记为答案? Northkildonan:这是一个失败查询的 mysqli 错误。 【参考方案1】:

问题

当使用原生 PHP ODBC 功能(PDO_ODBC 或较旧的odbc_ 函数)和 Access ODBC 驱动程序时,文本不是 UTF-8 编码的,即使它作为 Unicode 字符存储在 Access 数据库中。因此,对于名为“Teams”的示例表

Team
-----------------------
Boston Bruins
Canadiens de Montréal
Федерация хоккея России

代码

<?php
header('Content-Type: text/html; charset=utf-8');
?>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Access character test</title>
</head>
<body>
<?php
$connStr = 
        'odbc:' .
        'Driver=Microsoft Access Driver (*.mdb);' .
        'Dbq=C:\\Users\\Public\\__SO\\28311687.mdb;' .
        'Uid=Admin;';
$db = new PDO($connStr);
$db->setAttribute(PDO::ATTR_ERRMODE, PDO::ERRMODE_EXCEPTION);

$sql = "SELECT Team FROM Teams";
foreach ($db->query($sql) as $row) 
    $s = $row["Team"];
    echo $s . "<br/>\n";

?>
</body>
</html>

在浏览器中显示

Boston Bruins
Canadiens de Montr�al
????????? ?????? ??????

简单但不完整的修复

Access ODBC 返回的文本实际上与该字符集中字符的Windows-1252 字符编码匹配,因此只需更改行

$s = $row["Team"];

$s = utf8_encode($row["Team"]);

将允许正确显示第二个条目

Boston Bruins
Canadiens de Montréal
????????? ?????? ??????

但utf8_encode() function 转换自ISO-8859-1,而不是Windows-1252,因此某些字符(尤其是欧元符号“€”)会消失。更好的解决方案是使用

$s = mb_convert_encoding($row["Team"], "UTF-8", "Windows-1252");

但这仍然不能解决我们示例表中第三个条目的问题。

完整修复

要获得完整的 UTF-8 支持,我们需要将 COM 与 ADODB Connection 和 Recordset 对象一起使用

<?php
header('Content-Type: text/html; charset=utf-8');
?>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Access character test</title>
</head>
<body>
<?php
$connStr = 
        'Driver=Microsoft Access Driver (*.mdb);' .
        'Dbq=C:\\Users\\Public\\__SO\\28311687.mdb';
$con = new COM("ADODB.Connection", NULL, CP_UTF8);  // specify UTF-8 code page
$con->Open($connStr);

$rst = new COM("ADODB.Recordset");
$sql = "SELECT Team FROM Teams";
$rst->Open($sql, $con, 3, 3);  // adOpenStatic, adLockOptimistic
while (!$rst->EOF) 
    $s = $rst->Fields("Team");
    echo $s . "<br/>\n";
    $rst->MoveNext;

$rst->Close();
$con->Close();
?>
</body>
</html>

【讨论】:

嗨,戈德,我试过这段代码,但它不适合我。我也在使用 MS Access 数据库,数据是印地语的。我也可以在数据库中看到它。但是使用上面的代码它正在打印????仅限。【参考方案2】:

更容易操作数据。 (矩阵数组)。

function consulta($sql) 
        $db_path =  $_SERVER["DOCUMENT_ROOT"] . '/database/Registros.accdb';
        $conn = new COM('ADODB.Connection', NULL, CP_UTF8) or exit('Falha ao iniciar o ADO (objeto COM).'); 
        $conn->Open("Persist Security Info=False;Provider=Microsoft.ACE.OLEDB.12.0;Jet OLEDB:Database Password=ifpb@10510211298;Data Source=$db_path"); 
        $rs = $conn->Execute($sql);
        $numRegistos = $rs->Fields->Count;
        $index = 0;
        while (!$rs->EOF)      
            for ($n = 0; $n < $numRegistos; $n++) 
                if(is_null($rs->Fields[$n]->Value)) continue;
                $resultados[$index][$rs->Fields[$n]->Name] = $rs->Fields[$n]->Value;
                echo '.';
            
            echo '<br>';
            $index = $index + 1;
            $rs->MoveNext();
        
        $conn->Close();
        return $resultados;
    

    $dados = consulta("select * from campus");

    var_dump($dados);

【讨论】:

【参考方案3】:

找到以下解决方案。没错,我没有机会在 php 上测试它。但我想应该会成功的。

为了让原生 PHP ODBC 功能(PDO_ODBC 或较旧的 odbc_ 函数)和 Access ODBC 驱动程序能够正确减去以 Unicode 编码存储在 Access 数据库中作为 Unicode 字符的文本,需要启用“Beta : 使用 Unicode UTF-8 支持全球语言”在 Windows 操作系统的区域设置中。

在我这样做之后,许多使用标准 ODBC 驱动程序 MC Access 的程序开始以 Unicode 编码显示正确的文本。

所有设置 -> 时间和语言 -> 语言 -> “管理语言设置”

【讨论】:

以上是关于无法通过 PDO_ODBC 从 Access 检索 UTF-8 重音字符的主要内容,如果未能解决你的问题,请参考以下文章

PHP利用pdo_odbc实现连接数据库示例【基于ThinkPHP5.1搭建的项目】

PHP / MS Access DB 无法查询任何内容

无法从 Access DB 查询中检索数据到我的 VB 程序

通过 WPF 应用程序从 Access (.accdb) 中检索查询、表单和报表属性

PDO_ODBC 的字符编码问题

如何使用密码从 MS Access 数据库中检索网页数据