如何找到使用 MapReduce 获得最高销售额的一周?

Posted

技术标签:

【中文标题】如何找到使用 MapReduce 获得最高销售额的一周?【英文标题】:How to find the week which secured highest sales using MapReduce? 【发布时间】:2016-09-21 09:34:43 【问题描述】:

这是我的示例 .csv 文件。如何找到销售额最高的一周?

train.csv:

商店、部门、日期、每周销售、IsHoliday 1,1,2010-02-05,24924.5,FALSE 1,1,2010-02-12,46039.49,TRUE 1,1,2010-02-19,41595.55,FALSE 1,1,2010-02-26,19403.54,FALSE 1,1,2010-03-05,21827.9,FALSE 1,1,2010-03-12,21043.39,FALSE 1,1,2010-03-19,22136.64,FALSE 1,1,2010-03-26,26229.21,FALSE 1,1,2010-04-02,57258.43,FALSE

【问题讨论】:

在询问问题的答案之前,最好向我们表明您已经尝试过一些没有按预期工作的东西,或者至少有一个解决方案的想法。 我在 R 中试过 ...但我想使用 Mapreduce 【参考方案1】:

我不会为你提供代码,只是给你想法。

您可以找到每个映射器的本地最大销售额并发出 (sales,date) 对。为此,您可以使用映射器的清理方法,或使用组合器。

使用单个 reducer (setNumReduceTasks(1)),您将在 reduce 任务中获得所有局部最大值。保持 reducer 中的最大销售额并为其发出日期值。

【讨论】:

以上是关于如何找到使用 MapReduce 获得最高销售额的一周?的主要内容,如果未能解决你的问题,请参考以下文章

如何调整我的NoSQL查询以显示正确的结果?预期结果是显示软件的最高销售排名

如何使用 SQL 从每个组中获得最高得分球员?

PBI DAX 查询前 N 个以返回文本

如何获得具有相同最高值的所有键?

如何使用 python 在 mapreduce 中获得直方图(Graph)中的结果?

我如何找到这个学生数组中所有学生的最高、最低和总平均数