如何在不对股票数据执行聚合功能的情况下按日期分组

Posted

技术标签:

【中文标题】如何在不对股票数据执行聚合功能的情况下按日期分组【英文标题】:How to group by date without performing aggregate function on stock data 【发布时间】:2020-10-20 23:53:42 【问题描述】:

我目前有以下数据框:https://i.stack.imgur.com/doa0q.png

我希望我的数据框具有以下格式(AAPL、MSFT 和 FB 都应在彼此下方对齐):

2019 年 4 月 12 日:苹果公司

             MSFT

             FB

我尝试按日期分组,但在网上到处都执行我不想做的聚合函数。我怎样才能实现我想要的输出/我需要进一步阅读什么?

【问题讨论】:

【参考方案1】:

如果只是为了让您更容易获得概览,您可以像这样创建分层索引:

df.reset_index().set_index(['Date', 'Ticker'])

但是,pandas 本身不支持像这样打印出来。最重要的理由是,重新阅读将是一场噩梦,因此它仅对演示有用。

【讨论】:

这样我就可以对日期本身进行训练测试拆分。这样,测试集将是每个股票代码的 x%(取决于我选择的大小),而不是整个数据集的 x% 你应该看看scikit-learn.org/stable/modules/generated/…。它有一个参数stratify,我没有亲自使用过,但看起来它可以做你想要的开箱即用。

以上是关于如何在不对股票数据执行聚合功能的情况下按日期分组的主要内容,如果未能解决你的问题,请参考以下文章

Druid:如何在没有聚合功能的情况下将数值数据添加到指标中

Python Pandas 使用日期时间数据按日期分组

A股数据day级前复权数据下载与存储

如何对对象数据的mongodb聚合数组进行分组以对同一日期的数字求和

如何在交易数据中查询各个版本交易量前三的股票?(MySQL分组排名)

历年沪深A股香港H股票数据导入和实时数据更新展示 ---转载