使用 python pandas 操作 excel

Posted

技术标签:

【中文标题】使用 python pandas 操作 excel【英文标题】:Manipulate excel with python pandas 【发布时间】:2021-04-19 15:18:06 【问题描述】:

我遇到了一个奇怪的格式 excel format 的 Excel 问题,我希望用 python pandas 将它们放在合适的格式中,因为现在它们以天分隔,应该像这样@ 987654322@。 当我使用 read_excel 与 pandas 一起阅读它时,我想统一它们并从中删除第一个标题日期:

Unnamed: 1
NaN NaN
04Oct2020 (Sunday)  NaN
date & time         cars
04/10/2020 00:00:00 1
04/10/2020 00:01:00 2

到合适的形式是这样的:

date & time         cars
04/10/2020 00:00:00 1
04/10/2020 00:01:00 2
.
.
05/10/2020 00:00:00 1

(点表示日子是统一的)。我该怎么做?我没有成功,感谢任何帮助!

【问题讨论】:

这很容易做到。您当前的代码有什么错误? @MitchellOlislagers 我对此很陌生,我可以手动删除带有日期和日期的行,但想象一下,我有一个月的日子,而不是其中的两行,我必须手动做吗?还是有一种干净的方法来做到这一点? 【参考方案1】:

一种适用于您的数据集的非常老套的方法。

import pandas as pd

exclude = ["Mean", "STDEV", "Median", "Min", "Max", "date & time"]
df = pd.read_excel("test.xls", names = ["date_time", "cars"])
df = df[~df.date_time.isin(exclude)].dropna()
df.to_excel("testoutput.xls", index=False)

这会将这个输出写入一个新的 Excel 文件,删除行索引。

              date_time cars
1   2020-10-04 00:00:00    1
2   2020-10-04 00:01:00    2
3   2020-10-04 00:02:00    3
4   2020-10-04 00:03:00    4
5   2020-10-04 00:04:00    5
6   2020-10-04 00:05:00    6
7   2020-10-04 00:06:00    7
17  2020-10-05 00:00:00    1
18  2020-10-05 00:01:00    2
19  2020-10-05 00:02:00    3
20  2020-10-05 00:03:00    4
21  2020-10-05 00:04:00    5
22  2020-10-05 00:05:00    6
23  2020-10-05 00:06:00    7
24  2020-10-05 00:07:00    8
25  2020-10-05 00:08:00    9
26  2020-10-05 00:09:00   10

【讨论】:

以上是关于使用 python pandas 操作 excel的主要内容,如果未能解决你的问题,请参考以下文章

Python 自动化教程 : Excel自动化:使用pandas库

Python中操作Excel最好用的模块是?

python操作Excel的常见方法汇总 xlrd pandas xlwings

求助,使用Python合并多个EXCEL表格时,如果表格有密码,密码已知,该怎么通过pandas合并,

Python对Excel的操作

Python之Pandas的常用技能写入数据