具有无效字符的java xml

Posted

技术标签:

【中文标题】具有无效字符的java xml【英文标题】:java xml with invalid character 【发布时间】:2018-10-21 21:45:56 【问题描述】:

我有标签

在我的 xml 数据中具有值 *ÀÀ 5-À,这是 pojo 类的对象转换。 但我收到以下错误 在文档的元素内容中发现了无效的 XML 字符 (Unicode: 0x14)。任何建议如何删除无效字符。

【问题讨论】:

会建议您放入与您所拥有的类似的示例 xml,以便更容易找出问题。甚至可能是您用来加载 xml 的代码。 【参考方案1】:

将此添加到您的 xml 的开头:

<?xml version="1.0" encoding="utf-8"?>

如果您的 xml 不是使用 utf-8 编码创建的,请使用 notepad++ 之类的文本编辑器将编码设置为 utf-8。 (此选项在任务栏中作为编码)

此外,除了 0x9 (TAB)、0xA (CR?)、0xD (LF?) 之外,0x20 以下的所有字符都被禁止使用

如果您只对删除无效字符感兴趣,可以使用: https://confluence.atlassian.com/jira/removing-invalid-characters-from-xml-backups-12079.html

【讨论】:

是的,我也添加了,但这并不能解决问题。因为拉丁字符是由特定标签的xml获取的 尝试链接中提到的实用程序它应该做的事情。 :-)

以上是关于具有无效字符的java xml的主要内容,如果未能解决你的问题,请参考以下文章

XML(反)序列化无效字符串在c#中不一致?

解析Xml数据错误:文本内容中发现无效字符怎么处理

无效的 XML 字符错误 - 如何从 VARCHAR2 数据库列中查找无效字符?

在 C# 中转义无效的 XML 字符

XML / Java:解析标签和属性时的精确行和字符位置?

什么是 XML 中的无效字符