pyspark记录列的日志

Question

length = df.count()
df = df.withColumn("log", log(col("power"),lit(length)))

以下各行将引发此类错误。您能帮我用另一个值或另一个列作为基础来记录一列的日志。

TypeError                                 Traceback (most recent call last)
<ipython-input-102-c0894b6127d1> in <module>()
      1 #df.show()
      2 
----> 3 df = df.withColumn("log", log(col("power"),lit(2)))

5 frames
/content/spark-2.4.5-bin-hadoop2.7/python/pyspark/sql/column.py in __iter__(self)
    342 
    343     def __iter__(self):
--> 344         raise TypeError("Column is not iterable")
    345 
    346     # string methods

TypeError: Column is not iterable