Matlab使用 MapReduce 进行简单的数据子集化

Posted code_kd

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Matlab使用 MapReduce 进行简单的数据子集化相关的知识,希望对你有一定的参考价值。

提取大型数据集的子集。

子集化或执行查询有两个方面。一种是在数据集中选择变量(列)的子集。另一个是选择观察的子集或行。

在此示例中,变量的选择发生在数据存储的定义中。(地图功能可以执行进一步的变量子选择,但这不在本例的范围内)。在此示例中,映射函数的作用是执行观测值的选择。reduce 函数的作用是连接每次调用 map 函数提取的子集记录。这种方法假设数据集可以在 Map 阶段后装入内存。

准备数据


使用airlinesmall.csv数据集创建数据存储。这个 12 兆字节的数据集包含几家航空公司的 29 列航班信息,包括到达和离开时间。此示例使用数据中可用的 29 个变量中的 15 个变量。

ds = tabularTextDatastore(\'airlinesmall.csv\',

以上是关于Matlab使用 MapReduce 进行简单的数据子集化的主要内容,如果未能解决你的问题,请参考以下文章

Matlab使用 MapReduce 寻找最大值

Matlab使用 MapReduce 按组计算均值

Matlab使用 MapReduce 计算协方差和相关量

matlab怎么将生成的m序列量化为-1到1之间的数

Matlab使用 MapReduce 在 MATLAB 中分析大数据

Matlab使用 MapReduce 计算图像的最大平均 HSV