如何选择 sparkR 数据框的列值?
Posted
技术标签:
【中文标题】如何选择 sparkR 数据框的列值?【英文标题】:How to select the column values of sparkR data frame? 【发布时间】:2015-07-22 06:05:28 【问题描述】:我创建了一个 sparkR 数据框,人们
+----+-------+
| age| name|
+----+-------+
|20.0|Michael|
|30.0| Andy|
|19.0| Justin|
+----+-------+
如何在“年龄”列中选择第一个值。在 R 语言中,我们可以通过 people$age[1]
执行,结果为 20.0。我们如何在 sparkR 数据帧中做同样的事情。
TIA, 阿伦
【问题讨论】:
【参考方案1】:在 SparkR 中,您首先拥有该功能,该功能仅适用于 DataFrame,不适用于列。因此你可以这样做
first(people)$age
这仅适用于第一项。 SparkR DataFrame 没有行索引,但是您可以使用 head 或 take 来决定要获取多少项:
head(people, 5)$age
take(people, 5)$age
但是没有办法只取第五个元素。
【讨论】:
如果我想在 sparkr 的数据框中使用 [1:2] 怎么办以上是关于如何选择 sparkR 数据框的列值?的主要内容,如果未能解决你的问题,请参考以下文章
如何在python中使用正则表达式在字符串之间选择值并放置在数据框的列中