首页 > 解决方案 > 在 Pandas 中创建多维数据集

问题描述

我正在解决一个问题,考虑到尺寸大小,我很难概念化我需要做什么。我有各种格式的 csv 文件:

Date     Close    Volume  Target
1/1/18   120.1    223     0
1/2/18   112.1    219     1
1/3/18   175.1    224     0

这些 csv 文件中的每一个都代表一个单独的样本(一家公司的历史股票数据)。

我想获取多个与此类似的 csv 文件并将它们连接起来,以便它们包含在单个数据集中。因此,不是 csv 文件中的每个日期都是一个观察值(样本),而是现在整个集合都是一个样本(一个股票)。每个都有其日期样本。然后我计划通过逻辑回归算法运行它来预测目标。我可以概念化这种情况的唯一方法是执行以下操作:

Date     Close    Volume  Target
1/1/18   120.1    223     0
         88.1     120     1
1/2/18   112.1    219     1
         78.1     230     0
1/3/18   175.1    224     0
         89.1     112     1

对我来说,这种设置并没有多大意义,因为现在有重叠?每个价格集明显不同,但现在在同一列中。

如果有人能帮助我指出正确的方向,我将不胜感激。工作代码示例非常有帮助。还有一些附加的上下文,它用于连接一组库存 csv 文件,所以也许有人以前使用过这种数据。

谢谢。

标签: pythonpandas

解决方案


推荐阅读