使用 Cascalog/Cascading 读取 XML
Posted
技术标签:
【中文标题】使用 Cascalog/Cascading 读取 XML【英文标题】:reading XML with Cascalog/Cascading 【发布时间】:2013-07-18 22:27:42 【问题描述】:网上有一些信息表明 Mahout 的 XMLInputFormat 可用于在 hadoop 上有效地处理 XML,但我一直无法找到如何使其工作的示例。有人能指出我正确的方向吗?
我正在使用 Cascalog/Clojure。
【问题讨论】:
【参考方案1】:看看这个使用记录阅读器的hadoop实现读取一个xml文件:
http://javatute.com/javatute/faces/post/hadoop/2014/reading-simple-xml-file-using-hadoop.xhtml
【讨论】:
请注意,link-only answers are discouraged,SO 答案应该是搜索解决方案的终点(相对于另一个参考中途停留,随着时间的推移往往会变得陈旧)。请考虑在此处添加独立的概要,并保留链接作为参考。以上是关于使用 Cascalog/Cascading 读取 XML的主要内容,如果未能解决你的问题,请参考以下文章
如何在 initstate() 中读取和使用共享偏好值?我可以在其他小部件中读取和使用值,但不能在我在 initstate 中调用的 API 中读取和使用值