在 VB.NET 中将 UTF-8 转换为 windows-1255 编码
Posted
技术标签:
【中文标题】在 VB.NET 中将 UTF-8 转换为 windows-1255 编码【英文标题】:Converting UTF-8 to windows-1255 encoding in VB.NET 【发布时间】:2013-04-22 05:51:20 【问题描述】:我正在尝试将 UTF-8 编码的字符串转换为 VB.NET 中的 windows-1255,但没有成功。诚然,我不了解 VB,但尝试使用 MSDN 上的示例并根据我的需要对其进行修改:
Public Function Utf82Hebrew(ByVal Str As String) As String
Dim ascii As Encoding = Encoding.GetEncoding("windows-1255")
Dim unicode As Encoding = Encoding.Unicode
' Convert the string into a byte array.
Dim unicodeBytes As Byte() = unicode.GetBytes(Str)
' Perform the conversion from one encoding to the other.
Dim asciiBytes As Byte() = Encoding.Convert(unicode, ascii, unicodeBytes)
' Convert the new byte array into a char array and then into a string.
Dim asciiChars(ascii.GetCharCount(asciiBytes, 0, asciiBytes.Length)-1) As Char
ascii.GetChars(asciiBytes, 0, asciiBytes.Length, asciiChars, 0)
Dim asciiString As New String(asciiChars)
Utf82Hebrew = asciiString
End Function
这个函数实际上并没有做任何事情——字符串仍然是 UTF-8。但是,如果我更改此行:
Dim ascii As Encoding = Encoding.GetEncoding("windows-1255")
到这里:
Dim ascii As Encoding = Encoding.ASCII
然后函数返回问号代替字符串。
有谁知道如何将 UTF-8 字符串正确转换为特定编码(在本例中为 windows-1255),和/或我在上面的代码中做错了什么?
提前致谢。
【问题讨论】:
您要转换什么文本? 它可以是在 Web 表单中输入的任何希伯来语字符串。示例:שלום 没有“utf-8 字符串”之类的东西,字符串在 .NET 中始终以 utf-16 编码。 utf-8 只能存储在 byte[] 中。在您以某种方式将 utf-8 字节转换为字符串后,原始数据被破坏而无法修复,utf-8 包含没有 utf-16 表示的字节值。您需要从根本上解决此问题并修复生成“Str”参数的代码。 How to convert a UTF-8 string into Unicode? 的可能重复项 ASystem.String
在 .net 中始终是 UTF-16。 Utf-8 字符串将在 .net 中表示为字节数组。
【参考方案1】:
我修改了你的代码。 将文本从一种编码转换为另一种编码非常简单。 这就是您应该在 VB.Net 中执行此操作的方式。 Microsoft Windows 文件编码是 1252,而不是 1255。
Public Function Utf82Hebrew(ByVal Str As String) As String
Dim ascii As System.Text.Encoding = System.Text.Encoding.GetEncoding("1252")
Dim unicode As System.Text.Encoding = System.Text.Encoding.Unicode
' Convert the string into a byte array.
Dim unicodeBytes As Byte() = unicode.GetBytes(Str)
' Perform the conversion from one encoding to the other.
Dim asciiBytes As Byte() = System.Text.Encoding.Convert(unicode, ascii, unicodeBytes)
' Convert the new byte array into a char array and then into a string.
Dim asciiString As String = ascii.GetString(asciiBytes)
Utf82Hebrew = asciiString
End Function
【讨论】:
您好,感谢您的回答。诚然,这真的很老了,与我个人无关,但它对其他人有帮助:我不明白你改变的本质。您只是更改了目标编码,但想法是专门更改为 windows-1255。否则没用。另外,正如我记得这段代码一样,更改编码并没有做任何事情,除了 Encoding.ASCII。以上是关于在 VB.NET 中将 UTF-8 转换为 windows-1255 编码的主要内容,如果未能解决你的问题,请参考以下文章
如何在 VB.NET 中将 '<unnamed portal 1>' 转换为 plpgsql 函数的数据集
将 vb.net 类对象转换为 vb.net 中的 JSON 字符串
如何在 VB.NET 中将 DataGridView 导出为 Excel 格式