如何使用 jdbc pyspark python 在现有表中添加新列？

Posted 2023-03-27

技术标签:

【中文标题】如何使用 jdbc pyspark python 在现有表中添加新列？【英文标题】：How to add new column in existing table uaing jdbc pyspark python? 【发布时间】：2021-07-26 15:22:06 【问题描述】：

这是否可以在不覆盖现有表的情况下向现有表添加新列？所以如果表中有 col1 ，我想添加 col2 。所以在 .save() 之后会有 col1 和 col2 一起，而不仅仅是覆盖 col2。

提前谢谢你。

【问题讨论】：

尝试“从 your_table 中选择 col2”。如果这给您一个错误，则 col2 不存在（假设其他一切正常）。另一种方法是使用 ALTER TABLE 语句尝试添加 col2。如果 col2 存在，那么这将失败 【参考方案1】：

查看更改语法

https://spark.apache.org/docs/latest/sql-ref-syntax-ddl-alter-table.html

使用spark.sql(query)

与

f。 e. ALTER TABLE yourtable ADD columns (LastName string, DOB timestamp);

【讨论】：

这可以用 jdbc 连接器和 pyspark 做同样的事情吗？没有本机 mysql ？谢谢。不，我不知道任何只有有限的功能，这就是为什么你可以使用 ddl

以上是关于如何使用 jdbc pyspark python 在现有表中添加新列？的主要内容，如果未能解决你的问题，请参考以下文章