python - 有没有更好的方法来用 python 处理一个大的 excel?
问题描述
我正在尝试处理一组“大”数据。这是一张 5k 行 30 列的 Excel 表格。存储在单元格中的大部分数据都是字符串。我要做的是对这些数据执行简单的任务,例如:
字符串的重复次数
检查一些应该遵循同一行数据的规则(只需要几个 if 来检查它)
等等...
我的第一次尝试是创建 5k 个对象(每行 1 个),对其中的数据进行充电,然后开始运行测试。但是在这些对象中保存数据只需要 1k 行就需要一个小时。我在 python 中使用具有只读模式的模块 openpyexcel 进行了此操作。
我的问题是......有没有更快的方法来做到这一点?
我的问题的答案在这里 链接
解决方案
推荐阅读
- r - 用于多步前进和滞后回归器的模型时间包 -R
- android - ReactNative 未列出通过 Android 中的 USB 串行端口连接的设备
- r - 使用 group_by 在分组数据帧上应用 SummarizeGrowth
- javascript - 如何在 JavaScript 中抓取 URL 而不会损害嵌入式对象和内联 URL
- javascript - 如何从 Google Map JavaScript 中删除多边形的单边
- android - Android MediaCodec 实时 h264 编码/解码延迟
- postgresql - 如何在 Python Flask 中使用数据库模型?
- r - 基于现有变量创建多个新变量并同时重新编码它们 R
- python - 使用 python 更新 mongoDB
- rust - 返回 PhysicalDevice (Vulkano) 时“无法返回引用局部变量的值”