如何在 Clojure 中将 XML 转换为 edn?

Posted

技术标签:

【中文标题】如何在 Clojure 中将 XML 转换为 edn?【英文标题】:How to convert XML to edn in Clojure? 【发布时间】:2021-05-07 00:55:25 【问题描述】:

我是 Clojure 的新手,想将我拥有的 XML 转换为 edn 对象。

我读取的 XML 文件:

<Vehicle>
  <Model>Toyota</Model>
  <Color>Red</Color>
  <Loans>
    <Reoccuring>Monthly</Reoccuring>
    <Owners>
      <Owner>Bob</Owner>
    </Owners>
  </Loans>
  <Tires>
    <Model>123123</Model>
    <Size>23</Size>
  </Tires>
  <Engine>
    <Model>30065</Model>
  </Engine>
</Vehicle>

我已将其保存为 'test/resources/vehicle.xml

最终,我想要一个看起来像这样的 EDN 对象:

:Vehicle
    :Model "Toyota"
    :Color "Red"
    :Loans
        :Reoccuring "Monthly"
        :Owners
            :Owner "Bob"
    :Tires
        :Model 123123
        :Size 23
    :Engine
        :Model 30065

到目前为止,我在 Clojure 中尝试过的是 parse 方法:

(def xml-parser
  (parse "<Vehicle><Model>Toyota</Model><Color>Red</Color><Loans><Reoccuring>Monthly</Reoccuring><Owners><Owner>Bob</Owner></Owners></Loans><Tires><Model>123123</Model><Size>23</Size></Tires><Engine><Model>30065</Model></Engine></Vehicle>"))

但是,这会返回一个 Clojure 哈希,如下所示:

:tag :Vehicle, :attrs nil, :content [:tag :Model, :attrs nil, :content ["Toyota"] :tag :Color, :attrs nil, :content ["Red"] :tag :Loans, :attrs nil, :content [:tag :Reoccuring, :attrs nil, :content ["Monthly"] :tag :Owners, :attrs nil, :content [:tag :Owner, :attrs nil, :content ["Bob"]]] :tag :Tires, :attrs nil, :content [:tag :Model, :attrs nil, :content ["123123"] :tag :Size, :attrs nil, :content ["23"]] :tag :Engine, :attrs nil, :content [:tag :Model, :attrs nil, :content ["30065"]]]

我在转换的初始步骤中遇到了问题。提前感谢您的帮助。

【问题讨论】:

【参考方案1】:

您拥有的数据是 Enlive 格式的。使用clojure.pprint/pprint 查看更好的格式:

:tag :Vehicle,
 :attrs nil,
 :content
 [:tag :Model, :attrs nil, :content ["Toyota"]
  :tag :Color, :attrs nil, :content ["Red"]
  :tag :Loans,
   :attrs nil,
   :content
   [:tag :Reoccuring, :attrs nil, :content ["Monthly"]
    :tag :Owners,
     :attrs nil,
     :content [:tag :Owner, :attrs nil, :content ["Bob"]]]
  :tag :Tires,
   :attrs nil,
   :content
   [:tag :Model, :attrs nil, :content ["123123"]
    :tag :Size, :attrs nil, :content ["23"]]
  :tag :Engine,
   :attrs nil,
   :content [:tag :Model, :attrs nil, :content ["30065"]]]

问题是您想要的输出实际上不是合法的 EDN 数据格式。但是,您可以使用tupelo.forest 库在多种数据格式之间进行转换:

先声明数据并解析成Enlive格式:

(ns tst.demo.core
  (:use tupelo.core tupelo.test)
  (:require
    [tupelo.parse.xml :as xml]
    [tupelo.forest :as tf])
  )

(def xml-str
   "<Vehicle>
      <Model>Toyota</Model>
      <Color>Red</Color>
      <Loans>
        <Reoccuring>Monthly</Reoccuring>
        <Owners>
          <Owner>Bob</Owner>
        </Owners>
      </Loans>
      <Tires>
        <Model>123123</Model>
        <Size>23</Size>
      </Tires>
      <Engine>
        <Model>30065</Model>
      </Engine>
    </Vehicle> ")

验证结果

(dotest
  (let [data-enlive (xml/parse xml-str)]
    (is= data-enlive
      :tag     :Vehicle,
       :attrs   ,
       :content [:tag :Model, :attrs , :content ["Toyota"]
                 :tag :Color, :attrs , :content ["Red"]
                 :tag     :Loans,
                  :attrs   ,
                  :content [:tag :Reoccuring, :attrs , :content ["Monthly"]
                            :tag     :Owners,
                             :attrs   ,
                             :content [:tag :Owner, :attrs , :content ["Bob"]]]
                 :tag     :Tires,
                  :attrs   ,
                  :content [:tag :Model, :attrs , :content ["123123"]
                            :tag :Size, :attrs , :content ["23"]]
                 :tag     :Engine,
                  :attrs   ,
                  :content [:tag :Model, :attrs , :content ["30065"]]])

转换为打嗝格式:

    (is= (tf/enlive->hiccup data-enlive)
      [:Vehicle
       [:Model "Toyota"]
       [:Color "Red"]
       [:Loans [:Reoccuring "Monthly"]
        [:Owners [:Owner "Bob"]]]
       [:Tires [:Model "123123"]
        [:Size "23"]]
       [:Engine [:Model "30065"]]])

您可能也喜欢“灌木”格式:

    (is= (tf/enlive->bush data-enlive)
      [:tag :Vehicle
       [:tag :Model, :value "Toyota"]
       [:tag :Color, :value "Red"]
       [:tag :Loans
        [:tag :Reoccuring, :value "Monthly"]
        [:tag :Owners [:tag :Owner, :value "Bob"]]]
       [:tag :Tires
        [:tag :Model, :value "123123"]
        [:tag :Size, :value "23"]]
       [:tag :Engine [:tag :Model, :value "30065"]]])

或更详细的“树”格式

    (is= (tf/enlive->tree data-enlive)
      :tag :Vehicle,
       :tupelo.forest/kids
            [:tag :Model, :value "Toyota", :tupelo.forest/kids []
             :tag :Color, :value "Red", :tupelo.forest/kids []
             :tag :Loans,
              :tupelo.forest/kids
                   [:tag :Reoccuring, :value "Monthly", :tupelo.forest/kids []
                    :tag :Owners,
                     :tupelo.forest/kids
                          [:tag :Owner, :value "Bob", :tupelo.forest/kids []]]
             :tag :Tires,
              :tupelo.forest/kids
                   [:tag :Model, :value "123123", :tupelo.forest/kids []
                    :tag :Size, :value "23", :tupelo.forest/kids []]
             :tag :Engine,
              :tupelo.forest/kids
                   [:tag :Model, :value "30065", :tupelo.forest/kids []]])
    ))

见Tupelo Forest docs 了解完整信息。


上面的代码是使用this template project运行的。


如果您正在寻找分层地图样式的输出,您可以将类似这样的东西拼凑在一起:

(ns tst.demo.core
  (:use tupelo.core tupelo.test)
  (:require [clojure.walk :as walk]))

(dotest
  (let [data  [:Vehicle
               [:Model "Toyota"]
               [:Color "Red"]
               [:Loans
                [:Reoccuring "Monthly"]
                [:Owners
                 [:Owner "Bob"]]]
               [:Tires
                [:Model "123123"]
                [:Size "23"]]
               [:Engine
                [:Model "30065"]]]

        mappy (walk/postwalk
                (fn [item]
                  (if (vector? item)
                    (if (= 2 (count item))
                      (conj  item)
                      (first item)
                       (into  (rest item)))
                    item))
                data)]

通过测试

    (is= mappy
      :Vehicle
       :Model  "Toyota",
        :Color  "Red",
        :Loans  :Reoccuring "Monthly"
                 :Owners     :Owner "Bob",
        :Tires  :Model "123123"
                 :Size  "23",
        :Engine :Model "30065")))

虽然这写起来很脆弱。

【讨论】:

【参考方案2】:

您得到的输出是在 Clojure 中建模 XML 文档的最灵活的方法。正如 Alan Thompson 所说,它通常被称为 Enlive,因为 enlive 是推广该模型的库。目前尚不清楚您还希望得到什么,因为您的预期输出只是一堆没有结构的关键字。您可能一直希望 Hiccup 样式(再次在 Alan Thompson 的回答中描述)或嵌套地图(Alan Thompson 的回答称为“mappy”),但如果是这样,我敦促您重新考虑。 Hiccup 的唯一优点是易于手写。 Enlive 更容易消费和转换。

mappy 格式使用起来非常方便,但遗憾的是它与 XML 文档不是 1:1 对应的,因为那些可能有重复的元素名称,并且因为 mappy 没有办法描述属性,只能描述元素。因此,XML 解析器无法在不丢失保真度的情况下将其作为输出格式提供。如果您知道您的输入没有任何这些问题,您可以自己从 Enlive 编写一个转换函数 - 对于固定模式来说这很容易。

【讨论】:

Enlive 使用与 clojure.xml 相同的数据表示形式,从 1.0 版开始就成为 Clojure 的一部分。 你说的很对,clojure.xml 最先使用了这种格式。我已经修改了我的答案,说 Enlive 普及了它(直到 1.2 出现时我才出现,但即使是那个遥远的 clojure.xml 也不是流行的工具)。

以上是关于如何在 Clojure 中将 XML 转换为 edn?的主要内容,如果未能解决你的问题,请参考以下文章

如何在 Clojure 中将字符的 LazySeq 转换为字符串?

如何在 Clojure/Compojure/Ring 中将映射转换为 URL 查询字符串?

在 Clojure 中将元组数组转换为哈希映射

如何在 C# 中将嵌套列表转换为 XML

如何在 Ruby 中将 JSON 转换为 XML?

如何在java中将大型XML转换为字符串