如何根据时间对齐数据?
Posted
技术标签:
【中文标题】如何根据时间对齐数据?【英文标题】:How to align data based on time? 【发布时间】:2019-09-04 17:12:39 【问题描述】:我正在使用 pandas(python 库)来分析一组数据。 我的工作是根据时间调整这些数据。 我会解释: 我有不同的开关,如果按下或不按下,我会给我一个 1 或 0 按下后,一段时间后会自行恢复到之前的状态,并且有不同的开关。这些数据与状态的日期和时间一起保存在 csv 文件中。 我的目标是在如下图中查看一天的开关状态: https://ibb.co/RgJbq9J
开关可以在一天中的任何时间按下,我的问题是我无法对齐图表中的数据。
数据示例
datetime 1 switch 1 datetime 2 switch 2
08/12/2018 13:21:08 0 08/12/2018 10:15:59 1
08/12/2018 13:24:33 1 08/12/2018 10:18:13 0
08/12/2018 13:29:54 0 08/12/2018 10:29:28 1
08/12/2018 13:34:43 1 08/12/2018 10:31:37 0
08/12/2018 13:39:01 0 08/12/2018 10:34:01 1
08/12/2018 13:40:49 1 08/12/2018 10:36:14 0
08/12/2018 13:43:04 0 08/12/2018 10:37:05 1
08/12/2018 13:44:51 1 08/12/2018 10:39:19 0
08/12/2018 13:47:07 0 08/12/2018 10:40:03 1
08/12/2018 13:51:20 1 08/12/2018 10:42:15 0
08/12/2018 13:53:30 0 08/12/2018 10:42:51 1
08/12/2018 13:53:39 1 08/12/2018 10:45:14 0
08/12/2018 13:55:58 0 08/12/2018 10:52:29 1
08/12/2018 13:57:08 1 08/12/2018 10:54:49 0
08/12/2018 13:59:27 0 08/12/2018 11:01:01 1
08/12/2018 13:59:54 1 08/12/2018 11:05:32 0
这就是我的目标,在每天绘制的图表中显示所有开关。 该图与上表中的数据无关。
【问题讨论】:
您可以尝试使用pd.to_datetime()
将时间日期转换为特定格式,然后df = df.sort_values(by=['<time column>'])
按列排序。
数据已经按时间排序,问题是所有数据一起查看,x轴相同。所有开关都有一个带有 calura 和 datetime 的 CSV 文件,我的目标是查看所有具有相同时间轴 x 比例的开关。
@YatD3siB0y 试试pd.merge
或者在这里提供一些示例数据。
@YatD3siB0y 我同意希德的观点。在没有看到一些数据的情况下完成这将是非常困难的。你能提供几行.csv吗?状态是否记录为一天的开始/结束?
@MarkMoretto 我用一些数据和输出图表示例修改了帖子
【参考方案1】:
好的,我添加了一个额外的值集以显示一点多样性:
datetime 3 switch 3
0 2018-08-12 08:13:00.000 0
1 2018-08-12 08:13:01.915 0
2 2018-08-12 08:13:40.607 1
3 2018-08-12 08:14:02.863 0
4 2018-08-12 08:14:51.945 1
5 2018-08-12 08:15:57.060 0
6 2018-08-12 08:16:39.584 1
7 2018-08-12 08:16:48.351 1
8 2018-08-12 08:17:55.674 1
9 2018-08-12 08:18:46.208 0
10 2018-08-12 08:20:00.030 1
11 2018-08-12 08:20:02.992 0
12 2018-08-12 08:21:20.673 1
13 2018-08-12 08:22:29.867 1
14 2018-08-12 08:23:04.670 0
15 2018-08-12 08:23:54.177 0
脚本:
import os
import pandas as pd
import matplotlib.pyplot as plt
root = r'C:\Users\...\...'
file_name = 'test_file.xlsx'
full_path = os.path.join(root, file_name)
### Import data
df = pd.read_excel(full_path)
### Get our switch columns
switch_cols = [i for i in df.columns.values.tolist() if i.startswith('switch')]
### Subset our main dataframe to include only switch columns
df1 = df.reindex(columns=switch_cols).copy()
def plot_results(dataframe):
### Get swtich column names into a list
y_cols = [i for i in dataframe.columns.values.tolist()]
### Make the x-axis value set our dataframe axis values
x_vals = dataframe.index.values.tolist()
### Create subplots based on the numer of swtich columns
fig, axs = plt.subplots(len(y_cols), 1, sharex=True)
### Remove horizontal space between axes
fig.subplots_adjust(hspace = 0)
### Iterate over enumerated list of switch columns
for i, v in enumerate(switch_cols):
### set axes to plot values from a swtich set;
### Set drawstyle to 'steps-pre'
axs[i].plot(x_vals, dataframe[v].values, drawstyle='steps-pre')
### Add padding to y-axis limits
axs[i].set_ylim(-0.1, 1.1)
### Set y-axis label to switch column label
axs[i].set_ylabel(v)
### Plot results
plt.show()
plot_results(df1)
输出:
【讨论】:
我试过你的脚本,但它没有按我的意愿工作。我已经用这个数据试过了,imgur.com/a/ZCzshEj 如你所见,数据与白天的时间不一致以上是关于如何根据时间对齐数据?的主要内容,如果未能解决你的问题,请参考以下文章