使用负索引从pyspark字符串列的最后一个索引中对多个字符进行子字符串

Question

与Spark Dataframe column with last character of other column 密切相关，但我想从-1索引中提取多个字符。

我有以下pyspark数据帧df

+----------+----------+
|    number|event_type|
+----------+----------+
|0342224022|        11|
|0112964715|        11|
+----------+----------+

我想从number列的最后一个索引中提取3个字符。

我尝试了以下方法：

from pyspark.sql.functions import substring 
df.select(substring(df['number'], -1, 3), 'event_type').show(2)

# which returns:

+----------------------+----------+
|substring(number,-1,3)|event_type|
+----------------------+----------+
|                     2|        11|
|                     5|        11|
+----------------------+----------+

以下是预期的输出（我不确定上面的输出是什么）：

+----------------------+----------+
|substring(number,-1,3)|event_type|
+----------------------+----------+
|                   022|        11|
|                   715|        11|
+----------------------+----------+

我究竟做错了什么？

注意：Spark版本1.6.0