如何找到使用 MapReduce 获得最高销售额的一周?
Posted
技术标签:
【中文标题】如何找到使用 MapReduce 获得最高销售额的一周?【英文标题】:How to find the week which secured highest sales using MapReduce? 【发布时间】:2016-09-21 09:34:43 【问题描述】:这是我的示例 .csv 文件。如何找到销售额最高的一周?
train.csv:
商店、部门、日期、每周销售、IsHoliday 1,1,2010-02-05,24924.5,FALSE 1,1,2010-02-12,46039.49,TRUE 1,1,2010-02-19,41595.55,FALSE 1,1,2010-02-26,19403.54,FALSE 1,1,2010-03-05,21827.9,FALSE 1,1,2010-03-12,21043.39,FALSE 1,1,2010-03-19,22136.64,FALSE 1,1,2010-03-26,26229.21,FALSE 1,1,2010-04-02,57258.43,FALSE
【问题讨论】:
在询问问题的答案之前,最好向我们表明您已经尝试过一些没有按预期工作的东西,或者至少有一个解决方案的想法。 我在 R 中试过 ...但我想使用 Mapreduce 【参考方案1】:我不会为你提供代码,只是给你想法。
您可以找到每个映射器的本地最大销售额并发出 (sales,date)
对。为此,您可以使用映射器的清理方法,或使用组合器。
使用单个 reducer (setNumReduceTasks(1))
,您将在 reduce 任务中获得所有局部最大值。保持 reducer 中的最大销售额并为其发出日期值。
【讨论】:
以上是关于如何找到使用 MapReduce 获得最高销售额的一周?的主要内容,如果未能解决你的问题,请参考以下文章
如何调整我的NoSQL查询以显示正确的结果?预期结果是显示软件的最高销售排名