xs:anyURI 可以在 XSD 中包含方括号吗?

Posted

技术标签:

【中文标题】xs:anyURI 可以在 XSD 中包含方括号吗?【英文标题】:Can xs:anyURI contain square brackets in XSD? 【发布时间】:2017-06-13 01:58:00 【问题描述】:

XML 验证失败并出现错误:

元素“CategoryPageUrl”:“http://www.example.com/products?my_query_parameter[]=45”不是原子类型“xs:anyURI”的有效值。第​​ 29 行

Feed 如下所示:

    <Category>
        <ExternalId>1234</ExternalId>
        <Name>Name</Name>
        <CategoryPageUrl>http://www.example.com/products?my_query_parameter[]=45</CategoryPageUrl>
    </Category>

适当的架构如下所示:

<xs:complexType name="CategoryType">
  <xs:all>
    <xs:element name="ExternalId" type="ExternalIdType" minOccurs="0"/>
    <xs:element name="Name" type="xs:string" minOccurs="0"/>
    <xs:element name="CategoryPageUrl" type="xs:anyURI" minOccurs="0"/>
  </xs:all>
</xs:complexType>

【问题讨论】:

【参考方案1】:

不,xs:anyURI 不能包含方括号([])。

您的 URI 本身无效,而不仅仅是 XSD...

xs:anyURI 遵循RFC 2396,经RFC 2732 修正。

RFC 2396 对 URI 的 query 部分有以下产生式,您尝试在其中使用方括号:

  query         = *uric
  uric          = reserved | unreserved | escaped
  reserved      = ";" | "/" | "?" | ":" | "@" | "&" | "=" | "+" |
                  "$" | ","
  unreserved    = alphanum | mark
  mark          = "-" | "_" | "." | "!" | "~" | "*" | "'" |
                  "(" | ")"

  escaped       = "%" hex hex
  hex           = digit | "A" | "B" | "C" | "D" | "E" | "F" |
                          "a" | "b" | "c" | "d" | "e" | "f"

  alphanum      = alpha | digit
  alpha         = lowalpha | upalpha

  lowalpha = "a" | "b" | "c" | "d" | "e" | "f" | "g" | "h" | "i" |
             "j" | "k" | "l" | "m" | "n" | "o" | "p" | "q" | "r" |
             "s" | "t" | "u" | "v" | "w" | "x" | "y" | "z"
  upalpha  = "A" | "B" | "C" | "D" | "E" | "F" | "G" | "H" | "I" |
             "J" | "K" | "L" | "M" | "N" | "O" | "P" | "Q" | "R" |
             "S" | "T" | "U" | "V" | "W" | "X" | "Y" | "Z"
  digit    = "0" | "1" | "2" | "3" | "4" | "5" | "6" | "7" |
             "8" | "9"

如您所见,[] 不允许在那里。此外,根据2.4.3,方括号通常被认为是unwise URI 中的任何位置。排除的 US-ASCII 字符

unwise      = "" | "" | "|" | "\" | "^" | "[" | "]" | "`"

RFC 2732 确实使用 [] 定义了 IPv6 地址的语法,但这不在 URI 的 query 部分内。

【讨论】:

如果你有一个使用方括号的 URI,你可以用它们的百分比编码等效替换它们。 [ 变为 %5B] 变为 %5D。请注意,根据 RFC,使这些字符“不安全”的原因是“已知网关和其他传输代理有时会修改此类字符”。我想这在撰写本文时是正确的,但坦率地说,我怀疑它仍然是。无论如何,百分比编码的版本可能会避免这种风险。【参考方案2】:

另外,RFC1738 声明这些字符是不安全的

【讨论】:

以上是关于xs:anyURI 可以在 XSD 中包含方括号吗?的主要内容,如果未能解决你的问题,请参考以下文章

XSD 检查所有元素是不是在整个 XML 文件中包含相同的值

有人知道任何用于从 xsd 生成类的 T4 模板吗?

如何为 ID 名称中包含方括号的选项设置“选定”值? [复制]

在正则表达式字符括号中包含连字符?

将括号中包含多个字符串的文本解析为数组

如何在正则表达式公式中包含括号作为谷歌表格中公式的一部分