将 UTF-8 编码的 NSData 转换为 NSString

Posted

技术标签:

【中文标题】将 UTF-8 编码的 NSData 转换为 NSString【英文标题】:Convert UTF-8 encoded NSData to NSString 【发布时间】:2011-01-28 21:33:32 【问题描述】:

我有来自 Windows 服务器的 UTF-8 编码 NSData,我想将它转换为 iPhone 的 NSString。由于数据包含在两个平台上具有不同值的字符(如度数符号),如何将数据转换为字符串?

【问题讨论】:

UTF-8 在任何地方都是 UTF-8。一旦它是 UTF-8,对于不同的平台就没有不同的值。这就是它的全部意义。 【参考方案1】:

如果数据不是以null结尾的,你应该使用-initWithData:encoding:

NSString* newStr = [[NSString alloc] initWithData:theData encoding:NSUTF8StringEncoding];

如果数据以空值结尾,则应改为使用-stringWithUTF8String: 以避免末尾出现额外的\0

NSString* newStr = [NSString stringWithUTF8String:[theData bytes]];

(请注意,如果输入未正确 UTF-8 编码,您将得到nil。)


Swift 变体:

let newStr = String(data: data, encoding: .utf8)
// note that `newStr` is a `String?`, not a `String`.

如果数据以 null 结尾,您可以采用删除该 null 字符的安全方式,或者类似于上述 Objective-C 版本的不安全方式。

// safe way, provided data is \0-terminated
let newStr1 = String(data: data.subdata(in: 0 ..< data.count - 1), encoding: .utf8)
// unsafe way, provided data is \0-terminated
let newStr2 = data.withUnsafeBytes(String.init(utf8String:))

【讨论】:

小心!!如果使用 stringWithUTF8String,请不要传递 NULL 参数,否则会抛出异常 注意这一点:在非空终止的字符串上使用“stringWithUTF8String:”时,结果是不可预测的! 两种解决方案都为我返回 nil。 你怎么知道你的 NSData 是否是空终止的?请参阅 Tom Harrington 的回答:***.com/questions/27935054/…。以我的经验,永远不要假设 NSData 是否为空终止:它可能因一次传输而异,甚至与已知服务器不同。 @ElisevanLooij 感谢您的链接。我会争辩说,如果传输的数据可以随机以空值终止,或者协议是否定义不明确。【参考方案2】:

你可以调用这个方法

+(id)stringWithUTF8String:(const char *)bytes.

【讨论】:

仅当数据为空终止时。它可能不是(事实上,可能不是)。 我不知道为什么这会在非空终止字符串上中断,看看NSData 如何知道它有多少字节...... @Claudiu,你没有传递一个 NSData 对象,你传递的是一个用 [data bytes] 获得的 (const char *),它只是一个指针,没有大小信息。因此它指向的数据块必须是空终止的。查看文档,它说得很清楚。 @jbat100:当然。我不清楚。我的意思是,鉴于可以从非空终止的 NSData 变为 NSString(请参阅 KennyTM 的回答),我很惊讶没有 +(id)stringWithUTF8Data:(NSData *)data 可以正常工作。 stringWithUTF8Data,因此我们大多数人创建一个 NSString+Foo 类别并创建方法。【参考方案3】:

我谦虚地提交一个类别以减少烦人:

@interface NSData (EasyUTF8)

// Safely decode the bytes into a UTF8 string
- (NSString *)asUTF8String;

@end

@implementation NSData (EasyUTF8)

- (NSString *)asUTF8String 
    return [[NSString alloc] initWithData:self encoding:NSUTF8StringEncoding];    


@end

(请注意,如果您不使用 ARC,则需要autorelease。)

现在,而不是令人震惊的冗长:

NSData *data = ...
[[NSString alloc] initWithData:data encoding:NSUTF8StringEncoding];

你可以这样做:

NSData *data = ...
[data asUTF8String];

【讨论】:

【参考方案4】:

从 String 到 Data 再回到 String 的 Swift 版本:

Xcode 10.1 • Swift 4.2.1

extension Data 
    var string: String? 
        return String(data: self, encoding: .utf8)
    


extension StringProtocol 
    var data: Data 
        return Data(utf8)
    


extension String 
    var base64Decoded: Data? 
        return Data(base64Encoded: self)
    


游乐场

let string = "Hello World"                                  // "Hello World"
let stringData = string.data                                // 11 bytes
let base64EncodedString = stringData.base64EncodedString()  // "SGVsbG8gV29ybGQ="
let stringFromData = stringData.string                      // "Hello World"

let base64String = "SGVsbG8gV29ybGQ="
if let data = base64String.base64Decoded 
    print(data)                                    //  11 bytes
    print(data.base64EncodedString())              // "SGVsbG8gV29ybGQ="
    print(data.string ?? "nil")                    // "Hello World"


let stringWithAccent = "Olá Mundo"                          // "Olá Mundo"
print(stringWithAccent.count)                               // "9"
let stringWithAccentData = stringWithAccent.data            // "10 bytes" note: an extra byte for the acute accent
let stringWithAccentFromData = stringWithAccentData.string  // "Olá Mundo\n"

【讨论】:

【参考方案5】:

有时,其他答案中的方法不起作用。就我而言,我正在使用我的 RSA 私钥生成签名,结果是 NSData。我发现这似乎可行:

Objective-C

NSData *signature;
NSString *signatureString = [signature base64EncodedStringWithOptions:0];

斯威夫特

let signatureString = signature.base64EncodedStringWithOptions(nil)

【讨论】:

如何将该字符串获取到 nsdata ? @DarshanKunjadiya:Objective-C[[NSData alloc] initWithBase64EncodedString:signatureString options:0]; 斯威夫特NSData(base64EncodedString: str options: nil)【参考方案6】:

总结一下,这是一个完整的答案,对我有用。

我的问题是当我使用时

[NSString stringWithUTF8String:(char *)data.bytes];

我得到的字符串是不可预测的:大约 70% 确实包含预期值,但它经常导致 Null 或更糟:在字符串末尾被垃圾。

经过一番挖掘后,我切换到了

[[NSString alloc] initWithBytes:(char *)data.bytes length:data.length encoding:NSUTF8StringEncoding];

并且每次都得到了预期的结果。

【讨论】:

了解为什么得到“垃圾”结果很重要。【参考方案7】:

在 Swift 5 中,您可以使用 Stringinit(data:encoding:) 初始化程序,以便使用 UTF-8 将 Data 实例转换为 String 实例。 init(data:encoding:) 有以下声明:

init?(data: Data, encoding: String.Encoding)

返回一个String,通过使用给定编码将给定数据转换为Unicode字符来初始化。

下面的 Playground 代码展示了如何使用它:

import Foundation

let json = """

"firstName" : "John",
"lastName" : "Doe"

"""

let data = json.data(using: String.Encoding.utf8)!

let optionalString = String(data: data, encoding: String.Encoding.utf8)
print(String(describing: optionalString))

/*
 prints:
 Optional("\n\"firstName\" : \"John\",\n\"lastName\" : \"Doe\"\n")
*/

【讨论】:

以上是关于将 UTF-8 编码的 NSData 转换为 NSString的主要内容,如果未能解决你的问题,请参考以下文章

以哪种方式存储数据(图像)? NSData、字符串或可转换

在不编码的情况下将 NSData 转换为 NSString

如何以编程方式将 NSData 转换为 NSString? [复制]

在不知道编码类型的情况下将 NSData 转换为 NSString

ios 中怎样将汉字转成nsdata

将XML转换为Json(标记为UTF-16但具有UTF-8内容的文档)