将 Pandas DataFrame 中的日期对象列转换为字符串

Posted

技术标签:

【中文标题】将 Pandas DataFrame 中的日期对象列转换为字符串【英文标题】:Convert column of date objects in Pandas DataFrame to strings 【发布时间】:2013-11-13 07:51:10 【问题描述】:

如何将包含 datetime64 对象的列转换为可以读取的字符串 01-11-2013 表示今天的 11 月 1 日。

我试过了

df['DateStr'] = df['DateObj'].strftime('%d%m%Y')

但我收到此错误

AttributeError:“系列”对象没有属性“strftime”

【问题讨论】:

【参考方案1】:

从version 17.0 开始,您可以使用dt 访问器进行格式化:

df['DateStr'] = df['DateObj'].dt.strftime('%d%m%Y')

【讨论】:

发现这个在使用assign时真的很有用,比如:(df .query('my query criteria here) .assign(month = lambda x: x['date'].dt.strftime('%Y-%m') ) 这个方法会比df['A'].apply(lambda x: x.strftime('%d%m%Y')) 快一点。 230k col的cost time是1.3秒,后一个是1.9s左右。 对于较大的数据集,dt 访问器应该明显更快,因为 apply 或多或少是一个 for 循环,而 dt 使用基于 C 的优化 iirc。 我收到了警告:A value is trying to be set on a copy of a slice from a DataFrame.【参考方案2】:
In [6]: df = DataFrame(dict(A = date_range('20130101',periods=10)))

In [7]: df
Out[7]: 
                    A
0 2013-01-01 00:00:00
1 2013-01-02 00:00:00
2 2013-01-03 00:00:00
3 2013-01-04 00:00:00
4 2013-01-05 00:00:00
5 2013-01-06 00:00:00
6 2013-01-07 00:00:00
7 2013-01-08 00:00:00
8 2013-01-09 00:00:00
9 2013-01-10 00:00:00

In [8]: df['A'].apply(lambda x: x.strftime('%d%m%Y'))
Out[8]: 
0    01012013
1    02012013
2    03012013
3    04012013
4    05012013
5    06012013
6    07012013
7    08012013
8    09012013
9    10012013
Name: A, dtype: object

【讨论】:

以上是关于将 Pandas DataFrame 中的日期对象列转换为字符串的主要内容,如果未能解决你的问题,请参考以下文章

Python Pandas Dataframe 将特定的日期时间行标签设置为索引中的字符串?

pandas将dataframe中的年月日数据列合并成完整日期字符串并使用to_datetime将字符串格式转化为日期格式

pandas使用to_datetime函数将dataframe中的时间戳数据列(UNIX timestamp)转化为日期格式(datetime)数据列

pandas使用normalize函数将dataframe中的时间(time)数据列转化为日期(date)数据列(例如,从2019-12-25 11:30:00到2019-12-25)

pandas通过DatetimeProperties对象获取日期对象是否是所在月份的最后一天(is month end)筛选dataframe数据中日期对象是所在月份最后一天的数据行

pandas通过DatetimeProperties对象获取日期对象是否是所在年份的第一天(is year start)筛选dataframe数据中日期对象是所在年份第一天的数据行