在 pandas.merge_asof 之后保留两个合并键
Posted
技术标签:
【中文标题】在 pandas.merge_asof 之后保留两个合并键【英文标题】:keep both merging keys after pandas.merge_asof 【发布时间】:2018-10-14 13:32:01 【问题描述】:我发现了这个不错的函数pandas.merge_asof
。
来自文档
pandas.merge_asof(left, right, on=None, left_on=None, right_on=None)
Parameters:
left : DataFrame
right : DataFrame
on : label
Field name to join on. Must be found in both DataFrames.
The data MUST be ordered.
Furthermore this must be a numeric column,such as datetimelike, integer, or float.
On or left_on/right_on must be given.
它按预期工作。
但是,我的合并数据框只保留了 on
列中的原始列 left
。我需要保留它们,所以要有
mydf=pandas.merge_asof(left, right, on='Time')
和mydf
包含来自left
和right
的Time
示例数据:
a=pd.DataFrame(data=pd.date_range('20100201', periods=100, freq='6h3min'),columns=['Time'])
b=pd.DataFrame(data=
pd.date_range('20100201', periods=24, freq='1h'),columns=['Time'])
b['val']=range(b.shape[0])
out=pd.merge_asof(a,b,on='Time',direction='forward',tolerance=pd.Timedelta('30min'))
【问题讨论】:
你能添加一些数据样本吗? 我在上面……等等 【参考方案1】:我认为一种可能的解决方案是重命名列:
out = pd.merge_asof(a.rename(columns='Time':'Time1'),
b.rename(columns='Time':'Time2'),
left_on='Time1',
right_on='Time2',
direction='forward',
tolerance=pd.Timedelta('30min'))
print (out.head())
Time1 Time2 val
0 2010-02-01 00:00:00 2010-02-01 0.0
1 2010-02-01 06:03:00 NaT NaN
2 2010-02-01 12:06:00 NaT NaN
3 2010-02-01 18:09:00 NaT NaN
4 2010-02-02 00:12:00 NaT NaN
【讨论】:
可惜还是没有比改名更好的办法以上是关于在 pandas.merge_asof 之后保留两个合并键的主要内容,如果未能解决你的问题,请参考以下文章
如何使 pandas merge_asof 不仅包含所有事件