python - 在 Pandas 中创建多维数据集
问题描述
我正在解决一个问题,考虑到尺寸大小,我很难概念化我需要做什么。我有各种格式的 csv 文件:
Date Close Volume Target
1/1/18 120.1 223 0
1/2/18 112.1 219 1
1/3/18 175.1 224 0
这些 csv 文件中的每一个都代表一个单独的样本(一家公司的历史股票数据)。
我想获取多个与此类似的 csv 文件并将它们连接起来,以便它们包含在单个数据集中。因此,不是 csv 文件中的每个日期都是一个观察值(样本),而是现在整个集合都是一个样本(一个股票)。每个都有其日期样本。然后我计划通过逻辑回归算法运行它来预测目标。我可以概念化这种情况的唯一方法是执行以下操作:
Date Close Volume Target
1/1/18 120.1 223 0
88.1 120 1
1/2/18 112.1 219 1
78.1 230 0
1/3/18 175.1 224 0
89.1 112 1
对我来说,这种设置并没有多大意义,因为现在有重叠?每个价格集明显不同,但现在在同一列中。
如果有人能帮助我指出正确的方向,我将不胜感激。工作代码示例非常有帮助。还有一些附加的上下文,它用于连接一组库存 csv 文件,所以也许有人以前使用过这种数据。
谢谢。
解决方案
推荐阅读
- javascript - 用 flex 填充页面并用 body 将页脚粘贴到底部(Tailwindcss,Nextjs)
- javascript - 我在使用 npm 包 nexe 和 Visual Studio 时遇到问题,试图将 nodejs 应用程序转换为 .exe
- c - C 脚本不能正确地从文本文件中读取数据
- r - 如何在 R Shiny 中将起始页设置为空?
- python - 在 Python 中最小化一个函数
- amazon-dynamodb - 当使用 NodeJS 更新 DynamoDB 中的项目时出现错误 Invalid UpdateExpression
- amazon-s3 - 使签名的 cookie CloudFront 无效
- docker - Docker文件挂起python配置步骤
- node.js - 在面试中回答 CPU 密集型应用程序的简单定义是什么?
- shopify - 如何将自定义图标链接添加到 Shopify 标题