python - pandas 中数据存储/加载的方向
问题描述
第一次发帖,所以请温柔。我的编程知识非常有限,因为我来自更机械的背景,但我已经学习了一些 Python 的基础知识......
我们每天在 Excel 电子表格上收集 1 个月的抓取数据,我想做的是在仪表板上显示数据以便于跟踪趋势等。(我一直在玩 plotly.dash)我正在阅读 excel .xlsx 与带有 MultiIndex 的熊猫。目前,我有 2 年(或 24 个电子表格)想要使用的数据。下面的例子。
|Date | Batch| Qty Good| Thin| ...| Other| Qty Bad|
|01/11/2018| XY1234| 118147| 0| ...| 0| 0|
|01/11/2018| XY1235| 115454| 894| ...| 0| 0|
|02/11/2018| XY1236| 118900| 108| ...| 0| 0|
|... | ...| ...| ...| ...| ...| ...|
[108 rows x 225 columns]
我的问题是将所有内容转换为 .csv 然后将其组合为数据库以用于程序的初始启动,然后将新数据读取为 .xlsx 或者是否有更有效(和/或更好)的方法?
欢迎任何方向或建议。