如何根据时间对齐数据?

Posted

技术标签:

【中文标题】如何根据时间对齐数据?【英文标题】:How to align data based on time? 【发布时间】:2019-09-04 17:12:39 【问题描述】:

我正在使用 pandas(python 库)来分析一组数据。 我的工作是根据时间调整这些数据。 我会解释: 我有不同的开关,如果按下或不按下,我会给我一个 1 或 0 按下后,一段时间后会自行恢复到之前的状态,并且有不同的开关。这些数据与状态的日期和时间一起保存在 csv 文件中。 我的目标是在如下图中查看一天的开关状态: https://ibb.co/RgJbq9J

开关可以在一天中的任何时间按下,我的问题是我无法对齐图表中的数据。

数据示例

datetime 1          switch 1    datetime 2      switch 2
08/12/2018 13:21:08    0    08/12/2018 10:15:59    1
08/12/2018 13:24:33    1    08/12/2018 10:18:13    0
08/12/2018 13:29:54    0    08/12/2018 10:29:28    1
08/12/2018 13:34:43    1    08/12/2018 10:31:37    0
08/12/2018 13:39:01    0    08/12/2018 10:34:01    1
08/12/2018 13:40:49    1    08/12/2018 10:36:14    0
08/12/2018 13:43:04    0    08/12/2018 10:37:05    1
08/12/2018 13:44:51    1    08/12/2018 10:39:19    0
08/12/2018 13:47:07    0    08/12/2018 10:40:03    1
08/12/2018 13:51:20    1    08/12/2018 10:42:15    0
08/12/2018 13:53:30    0    08/12/2018 10:42:51    1
08/12/2018 13:53:39    1    08/12/2018 10:45:14    0
08/12/2018 13:55:58    0    08/12/2018 10:52:29    1
08/12/2018 13:57:08    1    08/12/2018 10:54:49    0
08/12/2018 13:59:27    0    08/12/2018 11:01:01    1
08/12/2018 13:59:54    1    08/12/2018 11:05:32    0

这就是我的目标,在每天绘制的图表中显示所有开关。 该图与上表中的数据无关。

【问题讨论】:

您可以尝试使用pd.to_datetime()将时间日期转换为特定格式,然后df = df.sort_values(by=['<time column>'])按列排序。 数据已经按时间排序,问题是所有数据一起查看,x轴相同。所有开关都有一个带有 calura 和 datetime 的 CSV 文件,我的目标是查看所有具有相同时间轴 x 比例的开关。 @YatD3siB0y 试试pd.merge 或者在这里提供一些示例数据。 @YatD3siB0y 我同意希德的观点。在没有看到一些数据的情况下完成这将是非常困难的。你能提供几行.csv吗?状态是否记录为一天的开始/结束? @MarkMoretto 我用一些数据和输出图表示例修改了帖子 【参考方案1】:

好的,我添加了一个额外的值集以显示一点多样性:

                datetime 3  switch 3  
0  2018-08-12 08:13:00.000         0  
1  2018-08-12 08:13:01.915         0  
2  2018-08-12 08:13:40.607         1  
3  2018-08-12 08:14:02.863         0  
4  2018-08-12 08:14:51.945         1  
5  2018-08-12 08:15:57.060         0  
6  2018-08-12 08:16:39.584         1  
7  2018-08-12 08:16:48.351         1  
8  2018-08-12 08:17:55.674         1  
9  2018-08-12 08:18:46.208         0  
10 2018-08-12 08:20:00.030         1  
11 2018-08-12 08:20:02.992         0  
12 2018-08-12 08:21:20.673         1  
13 2018-08-12 08:22:29.867         1  
14 2018-08-12 08:23:04.670         0  
15 2018-08-12 08:23:54.177         0  

脚本:

import os
import pandas as pd
import matplotlib.pyplot as plt

root = r'C:\Users\...\...'
file_name = 'test_file.xlsx'
full_path = os.path.join(root, file_name)

### Import data
df = pd.read_excel(full_path)

### Get our switch columns
switch_cols = [i for i in df.columns.values.tolist() if i.startswith('switch')]

### Subset our main dataframe to include only switch columns
df1 = df.reindex(columns=switch_cols).copy()


def plot_results(dataframe):
    ### Get swtich column names into a list
    y_cols = [i for i in dataframe.columns.values.tolist()]

    ### Make the x-axis value set our dataframe axis values
    x_vals = dataframe.index.values.tolist()

    ### Create subplots based on the numer of swtich columns
    fig, axs = plt.subplots(len(y_cols), 1, sharex=True)

    ### Remove horizontal space between axes
    fig.subplots_adjust(hspace = 0)

    ### Iterate over enumerated list of switch columns
    for i, v in enumerate(switch_cols):
        ### set axes to plot values from a swtich set;
        ### Set drawstyle to 'steps-pre'
        axs[i].plot(x_vals, dataframe[v].values, drawstyle='steps-pre')

        ### Add padding to y-axis limits
        axs[i].set_ylim(-0.1, 1.1)

        ### Set y-axis label to switch column label
        axs[i].set_ylabel(v)

    ### Plot results
    plt.show()

plot_results(df1)

输出:

【讨论】:

我试过你的脚本,但它没有按我的意愿工作。我已经用这个数据试过了,imgur.com/a/ZCzshEj 如你所见,数据与白天的时间不一致

以上是关于如何根据时间对齐数据?的主要内容,如果未能解决你的问题,请参考以下文章

如何根据子 SVG 内容对齐父 div 高度

如何根据第一个选定的项目对齐图形场景中的图形项目?

ggplot:如何根据变量类型在 geom_text 位置上设置不同的对齐方式?

如何根据 Vuetify 中的屏幕大小更改对齐方式?

如何根据文本视图的长度对齐文本视图

如何在android中根据上面的imageview对齐textview