将 UTF-8 编码的 NSData 转换为 NSString
Posted
技术标签:
【中文标题】将 UTF-8 编码的 NSData 转换为 NSString【英文标题】:Convert UTF-8 encoded NSData to NSString 【发布时间】:2011-01-28 21:33:32 【问题描述】:我有来自 Windows 服务器的 UTF-8 编码 NSData
,我想将它转换为 iPhone 的 NSString
。由于数据包含在两个平台上具有不同值的字符(如度数符号),如何将数据转换为字符串?
【问题讨论】:
UTF-8 在任何地方都是 UTF-8。一旦它是 UTF-8,对于不同的平台就没有不同的值。这就是它的全部意义。 【参考方案1】:如果数据不是以null结尾的,你应该使用-initWithData:encoding:
NSString* newStr = [[NSString alloc] initWithData:theData encoding:NSUTF8StringEncoding];
如果数据以空值结尾,则应改为使用-stringWithUTF8String:
以避免末尾出现额外的\0
。
NSString* newStr = [NSString stringWithUTF8String:[theData bytes]];
(请注意,如果输入未正确 UTF-8 编码,您将得到nil
。)
Swift 变体:
let newStr = String(data: data, encoding: .utf8)
// note that `newStr` is a `String?`, not a `String`.
如果数据以 null 结尾,您可以采用删除该 null 字符的安全方式,或者类似于上述 Objective-C 版本的不安全方式。
// safe way, provided data is \0-terminated
let newStr1 = String(data: data.subdata(in: 0 ..< data.count - 1), encoding: .utf8)
// unsafe way, provided data is \0-terminated
let newStr2 = data.withUnsafeBytes(String.init(utf8String:))
【讨论】:
小心!!如果使用 stringWithUTF8String,请不要传递 NULL 参数,否则会抛出异常 注意这一点:在非空终止的字符串上使用“stringWithUTF8String:”时,结果是不可预测的! 两种解决方案都为我返回 nil。 你怎么知道你的 NSData 是否是空终止的?请参阅 Tom Harrington 的回答:***.com/questions/27935054/…。以我的经验,永远不要假设 NSData 是否为空终止:它可能因一次传输而异,甚至与已知服务器不同。 @ElisevanLooij 感谢您的链接。我会争辩说,如果传输的数据可以随机以空值终止,或者协议是否定义不明确。【参考方案2】:你可以调用这个方法
+(id)stringWithUTF8String:(const char *)bytes.
【讨论】:
仅当数据为空终止时。它可能不是(事实上,可能不是)。 我不知道为什么这会在非空终止字符串上中断,看看NSData
如何知道它有多少字节......
@Claudiu,你没有传递一个 NSData 对象,你传递的是一个用 [data bytes] 获得的 (const char *),它只是一个指针,没有大小信息。因此它指向的数据块必须是空终止的。查看文档,它说得很清楚。
@jbat100:当然。我不清楚。我的意思是,鉴于可以从非空终止的 NSData
变为 NSString
(请参阅 KennyTM 的回答),我很惊讶没有 +(id)stringWithUTF8Data:(NSData *)data
可以正常工作。
stringWithUTF8Data,因此我们大多数人创建一个 NSString+Foo 类别并创建方法。【参考方案3】:
我谦虚地提交一个类别以减少烦人:
@interface NSData (EasyUTF8)
// Safely decode the bytes into a UTF8 string
- (NSString *)asUTF8String;
@end
和
@implementation NSData (EasyUTF8)
- (NSString *)asUTF8String
return [[NSString alloc] initWithData:self encoding:NSUTF8StringEncoding];
@end
(请注意,如果您不使用 ARC,则需要autorelease
。)
现在,而不是令人震惊的冗长:
NSData *data = ...
[[NSString alloc] initWithData:data encoding:NSUTF8StringEncoding];
你可以这样做:
NSData *data = ...
[data asUTF8String];
【讨论】:
【参考方案4】:从 String 到 Data 再回到 String 的 Swift 版本:
Xcode 10.1 • Swift 4.2.1
extension Data
var string: String?
return String(data: self, encoding: .utf8)
extension StringProtocol
var data: Data
return Data(utf8)
extension String
var base64Decoded: Data?
return Data(base64Encoded: self)
游乐场
let string = "Hello World" // "Hello World"
let stringData = string.data // 11 bytes
let base64EncodedString = stringData.base64EncodedString() // "SGVsbG8gV29ybGQ="
let stringFromData = stringData.string // "Hello World"
let base64String = "SGVsbG8gV29ybGQ="
if let data = base64String.base64Decoded
print(data) // 11 bytes
print(data.base64EncodedString()) // "SGVsbG8gV29ybGQ="
print(data.string ?? "nil") // "Hello World"
let stringWithAccent = "Olá Mundo" // "Olá Mundo"
print(stringWithAccent.count) // "9"
let stringWithAccentData = stringWithAccent.data // "10 bytes" note: an extra byte for the acute accent
let stringWithAccentFromData = stringWithAccentData.string // "Olá Mundo\n"
【讨论】:
【参考方案5】:有时,其他答案中的方法不起作用。就我而言,我正在使用我的 RSA 私钥生成签名,结果是 NSData。我发现这似乎可行:
Objective-C
NSData *signature;
NSString *signatureString = [signature base64EncodedStringWithOptions:0];
斯威夫特
let signatureString = signature.base64EncodedStringWithOptions(nil)
【讨论】:
如何将该字符串获取到 nsdata ? @DarshanKunjadiya:Objective-C:[[NSData alloc] initWithBase64EncodedString:signatureString options:0]
; 斯威夫特:NSData(base64EncodedString: str options: nil)
【参考方案6】:
总结一下,这是一个完整的答案,对我有用。
我的问题是当我使用时
[NSString stringWithUTF8String:(char *)data.bytes];
我得到的字符串是不可预测的:大约 70% 确实包含预期值,但它经常导致 Null
或更糟:在字符串末尾被垃圾。
经过一番挖掘后,我切换到了
[[NSString alloc] initWithBytes:(char *)data.bytes length:data.length encoding:NSUTF8StringEncoding];
并且每次都得到了预期的结果。
【讨论】:
了解为什么得到“垃圾”结果很重要。【参考方案7】:在 Swift 5 中,您可以使用 String
的 init(data:encoding:)
初始化程序,以便使用 UTF-8 将 Data
实例转换为 String
实例。 init(data:encoding:)
有以下声明:
init?(data: Data, encoding: String.Encoding)
返回一个
String
,通过使用给定编码将给定数据转换为Unicode字符来初始化。
下面的 Playground 代码展示了如何使用它:
import Foundation
let json = """
"firstName" : "John",
"lastName" : "Doe"
"""
let data = json.data(using: String.Encoding.utf8)!
let optionalString = String(data: data, encoding: String.Encoding.utf8)
print(String(describing: optionalString))
/*
prints:
Optional("\n\"firstName\" : \"John\",\n\"lastName\" : \"Doe\"\n")
*/
【讨论】:
以上是关于将 UTF-8 编码的 NSData 转换为 NSString的主要内容,如果未能解决你的问题,请参考以下文章
如何以编程方式将 NSData 转换为 NSString? [复制]