如何在 DataBricks 中使用 GUID/自动生成键创建表

Posted

技术标签:

【中文标题】如何在 DataBricks 中使用 GUID/自动生成键创建表【英文标题】:How to create table with GUID / Autogenerate key in DataBricks 【发布时间】:2019-11-21 06:04:28 【问题描述】:

我正在研究 AWS databricks 版本的 apache spark。想用主键和外键创建表模式。我相信 GUID 或自动生成键是创建任何主键的最佳实践。但是如何在databrick上创建,我正在寻找。 帮助表示赞赏

【问题讨论】:

【参考方案1】:

试试这个

 df = spark.table('your table name')

import uuid
from pyspark.sql.functions import udf

uuidUdf= udf(lambda : str(uuid.uuid4()),StringType())
df = df.withColumn("id",uuidUdf())

【讨论】:

以上是关于如何在 DataBricks 中使用 GUID/自动生成键创建表的主要内容,如果未能解决你的问题,请参考以下文章

如何在 Azure Databricks 中保存自定义 python 类对象?

EF,Code First - 如何在插入时设置自定义Guid标识值

如何使用 Spark sql 在 Databricks 中使用内部联接更新 Databricks Delta 表

在 Spark Azure Databricks 中创建自定义进度条指示器

如何在 Databricks 的 PySpark 中使用在 Scala 中创建的 DataFrame

如何在 Databricks 中使用 Python 将数据框数组拆分为列