如何在 DataBricks 中使用 GUID/自动生成键创建表
Posted
技术标签:
【中文标题】如何在 DataBricks 中使用 GUID/自动生成键创建表【英文标题】:How to create table with GUID / Autogenerate key in DataBricks 【发布时间】:2019-11-21 06:04:28 【问题描述】:我正在研究 AWS databricks 版本的 apache spark。想用主键和外键创建表模式。我相信 GUID 或自动生成键是创建任何主键的最佳实践。但是如何在databrick上创建,我正在寻找。 帮助表示赞赏
【问题讨论】:
【参考方案1】:试试这个
df = spark.table('your table name')
import uuid
from pyspark.sql.functions import udf
uuidUdf= udf(lambda : str(uuid.uuid4()),StringType())
df = df.withColumn("id",uuidUdf())
【讨论】:
以上是关于如何在 DataBricks 中使用 GUID/自动生成键创建表的主要内容,如果未能解决你的问题,请参考以下文章
如何在 Azure Databricks 中保存自定义 python 类对象?
EF,Code First - 如何在插入时设置自定义Guid标识值
如何使用 Spark sql 在 Databricks 中使用内部联接更新 Databricks Delta 表
在 Spark Azure Databricks 中创建自定义进度条指示器