Spark实战练习01--XML数据处理

Posted damonzjw

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Spark实战练习01--XML数据处理相关的知识,希望对你有一定的参考价值。

一、要求

将XML中的数据提取出来,并以account_number:model格式存储

1、XML文件数据格式

<activations>
  <activation timestamp="1225499258" type="phone">
  <account-number>316</account-number>
  <device-id>
    d61b6971-33e1-42f0-bb15-aa2ae3cd8680
  </device-id>
  <phone-number>5108307062</phone-number>
  <model>iFruit 1</model>
  </activation>

</activations>
2、存储格式:

1234:iFruit 1
987:Sorrento F00L
4566:iFruit 1

以上是关于Spark实战练习01--XML数据处理的主要内容,如果未能解决你的问题,请参考以下文章

Spark StreamingSpark Day10:Spark Streaming 学习笔记

Note_Spark_Day10:Spark Streaming

Spark StreamingSpark Day10:Spark Streaming 学习笔记

Spark StreamingSpark Day10:Spark Streaming 学习笔记

Spark机器学习实战-使用Spark进行数据处理和数据转换

spark数据分析练习