如何忽略未知标签的验证?

Posted

技术标签:

【中文标题】如何忽略未知标签的验证?【英文标题】:How to ignore the validation of Unknown tags? 【发布时间】:2011-01-25 00:55:13 【问题描述】:

对 XSD 功能的另一个挑战,我的客户一直在发送 XML 文件,这些文件将有 0 个或多个未定义或 [call] 意外标签(可能出现在层次结构中)。好吧,它们对我来说是多余的标签..所以我不得不忽略它们的存在,但除了它们之外,还有一些需要验证的标签。

这是一个示例 XML:

<root>
  <undefined_1>one</undefined_1>
  <undefined_2>two</undefined_2>
  <node>to_be_validated</node>
  <undefined_3>two</undefined_3>
  <undefined_4>two</undefined_4>
</root>

还有我试过的 XSD:

  <xs:element name="root" type="root"></xs:element>
  <xs:complexType name="root">
    <xs:sequence>
      <xs:any maxOccurs="2" minOccurs="0"/>
      <xs:element name="node" type="xs:string"/>
      <xs:any maxOccurs="2" minOccurs="0"/>
    </xs:sequence>
  </xs:complexType

由于某些原因,XSD 不允许这样做。 上述示例只是一个示例。实用的 XML 带有复杂的 XML 标签层次结构..

如果你能破解它,请告诉我。

顺便说一句,替代解决方案是在验证过程之前插入 XSL 转换。好吧,我正在避免它,因为我需要更改触发验证过程的 .Net 代码,这至少得到我公司的支持。

【问题讨论】:

是不是没有针对 schema 进行验证的问题? 是的 .. 我想表明“我不知道怎么做 .. 我试过了” .. 【参考方案1】:

也许可以使用命名空间:

<xs:element name="root" type="root"></xs:element> 
  <xs:complexType name="root"> 
    <xs:sequence> 
      <xs:any maxOccurs="2" minOccurs="0" namespace="http://ns1.com" /> 
      <xs:element name="node" type="xs:string"/> 
      <xs:any maxOccurs="2" minOccurs="0" namespace="http://ns2.com"/> 
    </xs:sequence> 
  </xs:complexType>

这可能会验证。

【讨论】:

深思熟虑 [+1].. 但不幸的是在我的情况下不起作用。感谢您的回复。 :-)【参考方案2】:

结论:

这在 XSD 中是不可能的。我试图达到要求的所有方法都被验证工具命名为“模棱两可”,伴随着一堆错误。

【讨论】:

【参考方案3】:

如果您还没有这样做,您可以尝试以下方法:

<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
  <xs:element name="root" type="root"></xs:element>
  <xs:complexType name="root">
    <xs:sequence>
      <xs:any maxOccurs="2" minOccurs="0" processContents="skip"/>
      <xs:element name="node" type="xs:string"/>
      <xs:any maxOccurs="2" minOccurs="0" processContents="skip"/>
    </xs:sequence>
  </xs:complexType>
</xs:schema>

在 Linux 下,使用 libxml 版本 20706 的 xmllint 可以正常工作。

【讨论】:

但是它仍然不允许第一个元素是 ANY! :( 请问到底是什么问题? 这是我得到的错误:通配符“##any”允许元素“节点”,并导致内容模型变得不明确。某某 这看起来像是一个概念问题。有关详细信息,请参阅此处:w3.org/TR/xmlschema-1/#cos-nonambig 对我来说一个有趣的事实是,显然不同的工具处理这种情况的方式不同。正如我所写,我提供的解决方案确实适用于提到的工具。 好吧。感谢您提供的信息和您宝贵的时间 :) 虽然我无法实现它,但它很有帮助,因为我只需要处理 .net :)【参考方案4】:

我遇到了同样的问题。

因为我从 .NET 调用了验证;我决定抑制 ValidationEventHandler 中的特定验证错误作为解决方法。它对我有用。

    private void ValidationEventHandler(object sender, ValidationEventArgs e)
    
        switch (e.Severity)
        
            case XmlSeverityType.Warning:
                // Processing warnings
                break;
            case XmlSeverityType.Error:
                if (IgnoreUnknownTags
                    && e.Exception is XmlSchemaValidationException
                    && new Regex(
                        @"The element '.*' has invalid child element '.*'\."
                        + @" List of possible elements expected:'.*'\.")
                       .IsMatch(e.Exception.Message))
                
                    return;
                
                // Processing errors
                break;
            default:
                throw new InvalidEnumArgumentException("Severity should be one of the valid values");
        
    

必须将Thread.CurrentUICulture 设置为英语或CultureInfo.InvariantCulture 以使当前线程正常工作,这一点很重要。

【讨论】:

【参考方案5】:

您可以利用 XML 1.1 中称为“开放内容”的新功能。简而言之,它允许您指定额外的“未知”元素可以添加到复杂类型的不同位置,以及解析器遇到这些元素时应该做什么。

使用 XML 1.1,您的复杂类型将变为:

<xs:element name="root" type="root" />
<xs:complexType name="root"> 
  <xs:openContent mode="interleave">
    <xs:any namespace="##any" processContents="skip"/>
  </xs:openContent>

  <xs:sequence> 
    <xs:element name="node" type="xs:string"/> 
  </xs:sequence> 
</xs:complexType>

如果你有很多复杂的类型,你也可以在你的架构顶部设置一个“默认”的开放内容模式:

<xs:schema ...>
  <xs:defaultOpenContent mode="interleave">
    <xs:any namespace="##any" processContents="skip"/>
  </xs:defaultOpenContent>

  ...
</xs:schema>

关于开放内容的 W3C 规范可以在 http://www.w3.org/TR/xmlschema11-1/#oc 找到,http://www.ibm.com/developerworks/library/x-xml11pt3/#N102BA 对此有很好的描述。

不幸的是,.NET 不支持 XML 1.1,但我找不到任何免费的 XML 1.1 处理器 - 但有几个付费选项是:

http://www.saxonica.com/ http://www.altova.com/raptorxml.html

【讨论】:

以上是关于如何忽略未知标签的验证?的主要内容,如果未能解决你的问题,请参考以下文章

Joi 对象验证:如何验证具有未知键名的值?

忽略树枝中的未知标签

如何解决错误:Laravel-MySql 中的 SQL 身份验证方法未知

如何忽略范围输入类型的验证

处理标签编码的未知值

JPA Hibernate,如何在创建时进行验证,而在更新时忽略验证