python - 高效地逐行读取Excel文件
问题描述
我正在尝试处理约 600k 行和约 10 列的 excel 文件。
我想逐行(或逐行)执行一些程序,就好像它是一个迭代器(如 txt/csv 文件)。但是,如果我使用xlrd
或pandas
读取 excel 文件,打开文件大约需要 2-3 分钟。
我想知道是否可以有效地逐行读取 excel 文件,例如,我可以用前 10 行验证我的程序,而无需为每次试验等待很长时间。
编辑:感谢您建议在处理之前将 excel 文件转换为 csv。但是,我必须为用户创建一个一键式程序。所以,如果可能的话,我还是希望能找到一种直接高效读取excel文件的方法。
解决方案
pandas read_excel有一个nrows参数,用于控制要读取的行数。
pd.read_excel(your_xslx_file.xlsx, nrows=10)
您可以读取所需的行数,如果您需要它开始进一步阅读文件,可以使用参数skiprows来控制。
推荐阅读
- python - 如何遍历多个 s3 存储桶以查找 PublicAccessBlockConfiguration 中的所有值是否都设置为 TRUE
- c++ - 我达到 18 分后,蛇游戏停止。为什么?
- javascript - 如何知道if语句中具有最大长度文本的按钮的第i个值
- c++ - 如何在构造函数中构建动态二维数组?
- c - 指向数组第一个元素的指针是UB。这是什么时候第一次这样定义的?
- wget - wget:从 URL 列表中下载大于 1000KB 的图像文件并从文件名中去除 URL 参数
- sql - 如何优化此查询以从两列中检索特定结构?
- android - 无法打开 Android 解析器设置
- sql - SQL查询查找相同的ID但不同的名称
- arrays - 如何用Angular Material中的服务数据填充表格?