将 Pandas DataFrame 中的日期对象列转换为字符串
Posted
技术标签:
【中文标题】将 Pandas DataFrame 中的日期对象列转换为字符串【英文标题】:Convert column of date objects in Pandas DataFrame to strings 【发布时间】:2013-11-13 07:51:10 【问题描述】:如何将包含 datetime64 对象的列转换为可以读取的字符串 01-11-2013 表示今天的 11 月 1 日。
我试过了
df['DateStr'] = df['DateObj'].strftime('%d%m%Y')
但我收到此错误
AttributeError:“系列”对象没有属性“strftime”
【问题讨论】:
【参考方案1】:从version 17.0 开始,您可以使用dt
访问器进行格式化:
df['DateStr'] = df['DateObj'].dt.strftime('%d%m%Y')
【讨论】:
发现这个在使用assign
时真的很有用,比如:(df .query('my query criteria here) .assign(month = lambda x: x['date'].dt.strftime('%Y-%m') )
这个方法会比df['A'].apply(lambda x: x.strftime('%d%m%Y'))
快一点。 230k col的cost time是1.3秒,后一个是1.9s左右。
对于较大的数据集,dt
访问器应该明显更快,因为 apply 或多或少是一个 for 循环,而 dt
使用基于 C 的优化 iirc。
我收到了警告:A value is trying to be set on a copy of a slice from a DataFrame.
【参考方案2】:
In [6]: df = DataFrame(dict(A = date_range('20130101',periods=10)))
In [7]: df
Out[7]:
A
0 2013-01-01 00:00:00
1 2013-01-02 00:00:00
2 2013-01-03 00:00:00
3 2013-01-04 00:00:00
4 2013-01-05 00:00:00
5 2013-01-06 00:00:00
6 2013-01-07 00:00:00
7 2013-01-08 00:00:00
8 2013-01-09 00:00:00
9 2013-01-10 00:00:00
In [8]: df['A'].apply(lambda x: x.strftime('%d%m%Y'))
Out[8]:
0 01012013
1 02012013
2 03012013
3 04012013
4 05012013
5 06012013
6 07012013
7 08012013
8 09012013
9 10012013
Name: A, dtype: object
【讨论】:
以上是关于将 Pandas DataFrame 中的日期对象列转换为字符串的主要内容,如果未能解决你的问题,请参考以下文章
Python Pandas Dataframe 将特定的日期时间行标签设置为索引中的字符串?
pandas将dataframe中的年月日数据列合并成完整日期字符串并使用to_datetime将字符串格式转化为日期格式
pandas使用to_datetime函数将dataframe中的时间戳数据列(UNIX timestamp)转化为日期格式(datetime)数据列
pandas使用normalize函数将dataframe中的时间(time)数据列转化为日期(date)数据列(例如,从2019-12-25 11:30:00到2019-12-25)
pandas通过DatetimeProperties对象获取日期对象是否是所在月份的最后一天(is month end)筛选dataframe数据中日期对象是所在月份最后一天的数据行
pandas通过DatetimeProperties对象获取日期对象是否是所在年份的第一天(is year start)筛选dataframe数据中日期对象是所在年份第一天的数据行