如何选择 sparkR 数据框的列值?

Posted

技术标签:

【中文标题】如何选择 sparkR 数据框的列值?【英文标题】:How to select the column values of sparkR data frame? 【发布时间】:2015-07-22 06:05:28 【问题描述】:

我创建了一个 sparkR 数据框,人们

+----+-------+
| age|   name|
+----+-------+
|20.0|Michael|
|30.0|   Andy|
|19.0| Justin|
+----+-------+

如何在“年龄”列中选择第一个值。在 R 语言中,我们可以通过 people$age[1] 执行,结果为 20.0。我们如何在 sparkR 数据帧中做同样的事情。

TIA, 阿伦

【问题讨论】:

【参考方案1】:

在 SparkR 中,您首先拥有该功能,该功能仅适用于 DataFrame,不适用于列。因此你可以这样做

first(people)$age

这仅适用于第一项。 SparkR DataFrame 没有行索引,但是您可以使用 head 或 take 来决定要获取多少项:

head(people, 5)$age
take(people, 5)$age

但是没有办法只取第五个元素。

【讨论】:

如果我想在 sparkr 的数据框中使用 [1:2] 怎么办

以上是关于如何选择 sparkR 数据框的列值?的主要内容,如果未能解决你的问题,请参考以下文章

如何在主选择中使用嵌套选择中的列值?

如何在python中使用正则表达式在字符串之间选择值并放置在数据框的列中

如何使用 JPA 原生查询选择多个同名的列?

如何比较按一列分组的 SQL 中的列值?

如何对一个数据框中的列值求和并将结果添加为另一个数据框中的列?

如何根据数据框中的列值获取特定的行数[重复]