使用 Cascalog/Cascading 读取 XML

Posted

技术标签:

【中文标题】使用 Cascalog/Cascading 读取 XML【英文标题】:reading XML with Cascalog/Cascading 【发布时间】:2013-07-18 22:27:42 【问题描述】:

网上有一些信息表明 Mahout 的 XMLInputFormat 可用于在 hadoop 上有效地处理 XML,但我一直无法找到如何使其工作的示例。有人能指出我正确的方向吗?

我正在使用 Cascalog/Clojure。

【问题讨论】:

【参考方案1】:

看看这个使用记录阅读器的hadoop实现读取一个xml文件:

http://javatute.com/javatute/faces/post/hadoop/2014/reading-simple-xml-file-using-hadoop.xhtml

【讨论】:

请注意,link-only answers are discouraged,SO 答案应该是搜索解决方案的终点(相对于另一个参考中途停留,随着时间的推移往往会变得陈旧)。请考虑在此处添加独立的概要,并保留链接作为参考。

以上是关于使用 Cascalog/Cascading 读取 XML的主要内容,如果未能解决你的问题,请参考以下文章

怎样使用ReadFile读取文本文件?

gh读取csv文件

使用nodejs fs同时读取文件

angular读取文件

如何有效的使用C#读取文件

如何在 initstate() 中读取和使用共享偏好值?我可以在其他小部件中读取和使用值,但不能在我在 initstate 中调用的 API 中读取和使用值