python 在PySpark中为withColumn编写UDF

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 在PySpark中为withColumn编写UDF相关的知识,希望对你有一定的参考价值。

from pyspark.sql.types import StringType
from pyspark.sql.functions import udf

maturity_udf = udf(lambda age: "adult" if age >=18 else "child", StringType())

df = sqlContext.createDataFrame([{'name': 'Alice', 'age': 1}])
df.withColumn("maturity", maturity_udf(df.age))

以上是关于python 在PySpark中为withColumn编写UDF的主要内容,如果未能解决你的问题,请参考以下文章

在 PySpark 中为每一行查找最新的非空值

在 PySpark 中为镶木地板文件过滤日期时间范围和时区

如何在 Jupyter notebook 中为 pyspark 设置 MySQL 的 JDBC 驱动程序?

如何在 PySpark 中为一个组迭代 Dataframe / RDD 的每一行。?

CDH 中为spark 安装 python3

如何在 PySpark 中为数据框中的所有列替换字符串值与 NULL?