_bstr_t 到 UTF-8 可能吗?

Posted

技术标签:

【中文标题】_bstr_t 到 UTF-8 可能吗?【英文标题】:_bstr_t to UTF-8 possible? 【发布时间】:2010-10-12 04:20:58 【问题描述】:

我有一个包含日文文本的_bstr_t 字符串。我想将此字符串转换为定义为char * 的UTF-8 字符串。

我可以将_bstr_t 字符串转换为char * (UTF-8) 字符串而不会丢失日文字符吗?

【问题讨论】:

【参考方案1】:

使用 WideCharToMultiByte() – 传递 CP_UTF8 作为第一个参数。

请注意,BSTR 可以是空指针并且对应于空字符串 - 将此视为特殊情况。

【讨论】:

【参考方案2】:

这里是一些应该进行转换的代码。

void PrintUtf8(const TCHAR* value)  
    if (value == nullptr) 
        printf("");
        return;
    
    int n = WideCharToMultiByte(CP_UTF8, 0, value, -1, nullptr, 0, nullptr, nullptr);
    if (n <= 0) 
        printf("");
        return;
    
    char* buffer = new char[n];
    WideCharToMultiByte(CP_UTF8, 0, value, -1, buffer, n, nullptr, nullptr);
    printf("%s", buffer);
    delete(buffer);

【讨论】:

【参考方案3】:

这类事情非常方便的 MSDN 参考:http://msdn.microsoft.com/en-us/library/ms235631(VS.80).aspx

我认为您需要转到 wchar_t*,因为 char* 会丢失 Unicode 内容,尽管我不确定。

// convert_from_bstr_t.cpp
// compile with: /clr /link comsuppw.lib

#include <iostream>
#include <stdlib.h>
#include <string>

#include "atlbase.h"
#include "atlstr.h"
#include "comutil.h"

using namespace std;
using namespace System;

int main()

    _bstr_t orig("Hello, World!");
    wcout << orig << " (_bstr_t)" << endl;

    // Convert to a char*
    const size_t newsize = 100;
    char nstring[newsize];
    strcpy_s(nstring, (char *)orig);
    strcat_s(nstring, " (char *)");
    cout << nstring << endl;

    // Convert to a wchar_t*
    wchar_t wcstring[newsize];
    wcscpy_s(wcstring, (wchar_t *)orig);
    wcscat_s(wcstring, L" (wchar_t *)");
    wcout << wcstring << endl;

    // Convert to a CComBSTR
    CComBSTR ccombstr((char *)orig);
    if (ccombstr.Append(L" (CComBSTR)") == S_OK)
    
        CW2A printstr(ccombstr);
        cout << printstr << endl;
    

    // Convert to a CString
    CString cstring((char *)orig);
    cstring += " (CString)";
    cout << cstring << endl;

    // Convert to a basic_string
    string basicstring((char *)orig);
    basicstring += " (basic_string)";
    cout << basicstring << endl;

    // Convert to a System::String
    String ^systemstring = gcnew String((char *)orig);
    systemstring += " (System::String)";
    Console::WriteLine("0", systemstring);
    delete systemstring;

【讨论】:

感谢您的回复尼克。问题是我想通过 Windows 套接字发送这个 _bstr_t 内容,它只允许发送 char* 类型(请检查 ws2def.h 文件中的 WSABUF 结构)。现在 wchat 不会做。 _WSABUF 结构是否有宽字符版本? Windows 套接字不关心您发送什么数据。在这种情况下,您只需将 reinterpret_cast 重新解释为 char* 就可以了。 只是不要弄乱字节数 - 它是 Unicode 字符数乘以 sizeof(WCHAR) - 并且使用空 BSTR。 虽然 Windows Sockets 不关心发送什么数据,但如果目的地需要理解数据并且使用不同的字节顺序,最好使用 UTF-8。尤其是在使用两种字节顺序的系统的混合环境中。

以上是关于_bstr_t 到 UTF-8 可能吗?的主要内容,如果未能解决你的问题,请参考以下文章

_bstr_t和_variant_t是怎样定义的

关于使用_bstr_t的一个坑

释放从 char* 创建的 _bstr_t

将 _bstr_t 对象传递给期望 BSTR 作为参数的函数是不是安全?

CComVariant 与 _variant_t、CComBSTR 与 _bstr_t

如何将_bstr_t转换为CString