使用 Scala 清理 RDD 中的开括号和闭括号

Posted

技术标签:

【中文标题】使用 Scala 清理 RDD 中的开括号和闭括号【英文标题】:Clean up open and closed brackets in RDD using Scala 【发布时间】:2017-03-30 09:46:38 【问题描述】:

在使用 spark 和 scala 对文件进行一些转换后,我得到了如下结果

(451,M,(BC-B,(21104246,321.50)))
(454,M,(OC,(21104751,361.00)))
(147,M,(OC,(20404588,340.00)))
(155,M,(BC-B,(20405733,347.00)))

但我需要删除括号并期望输出如下,因为我需要将 rdd 转换为数据帧

454,M,OC,21104751,361.00  
451,M,BC-B,21104246,321.50
147,M,OC,20404588,340.00
155,M,BC-B,20405733,347.00

任何帮助都是可观的!!!

【问题讨论】:

【参考方案1】:

你可以直接匹配出来:

rdd.mapcase (a,b,(c,(d,e))) => (a,b,c,d,e).toDF()

【讨论】:

感谢您的回复,我已经使用替换所有功能,它工作正常....我也会试试你的并检查

以上是关于使用 Scala 清理 RDD 中的开括号和闭括号的主要内容,如果未能解决你的问题,请参考以下文章

Scala方法调用中的花括号[重复]

怎样在scala正则表达式提取器中使用小括号

清理多种语言中的大括号

形态学的开闭运算与字面上的“开”和“闭”的本来的意义有啥关系?

scala map 后加小括号和大括号的区别

何时在 Scala 中缀表示法中使用括号