首页 > 解决方案 > 提高文件下载速度

问题描述

我已经分析了按tottime. 大部分时间都花在了这里:

  1. \xlrd\xlsx.py:620(do_row)
  2. {method 'feed' of 'xml.etree.ElementTree.XMLParser' objects}
  3. xlrd\xlsx.py:540(own_process_stream)
  4. {method 'read' of '_ssl._SSLSocket' bjects}
  5. xml\etree\ElementTree.py:1286(read_events)
  6. xlrd\sheet.py:691(put_cell_unragged)
  7. pandas\io\excel.py:491(_parse_excel)

我正在尝试优化我创建的库bls-datasets。它下载 excel 文件并将它们转换为数据框。有些文件非常大(> 50mb),需要一些时间才能下载。重申一下,下载是成功的,只是较大的文件需要很长时间。

我很好奇是否有任何其他选项可以提高此下载的速度,或者它是否超出我的控制范围。

目前,我正在使用 arequests.get()来获取 ziparchive,将其转换为 zipfile 对象,然后打开 zipfile 的指定文件。

标签: pythonpython-requests

解决方案


推荐阅读