python-3.x - 将大型 sas 文件读入块
问题描述
迭代块时遇到错误,
compustat = pd.read_sas("F:\\COMPUSTAT_annually.sas7bdat",
encoding='ISO-8859-1',
chunksize=1500)
dfs = []
i = 0
for chunk in compustat:
dfs.append(chunk)
i += 1
print(i)
当 i == 262 时,它说:
-------------------------------------------------- ------------------------- ValueError Traceback(最近一次调用最后一次) D:\Anaconda\lib\site-packages\pandas\io\sas\ sas7bdat.py in _read_next_page(self) 738 f"{len(self._cached_page):d} of {self._page_length:d} bytes)" 739) --> 740 raise ValueError(msg) 741 742 self._read_page_header()
ValueError:无法从文件中读取完整页面(读取 65536 个字节,共 131072 个字节) 异常被忽略:'pandas.io.sas._sas.Parser.read_next_page' Traceback(最近一次调用):文件“D:\Anaconda\lib\ site-packages\pandas\io\sas\sas7bdat.py",第 740 行,在 _read_next_page 中引发 ValueError(msg) ValueError:无法从文件中读取完整页面(读取 65536 个字节,共 131072 个字节)
我搜索但没有看到这个问题的答案......不确定它是否与 sas 阅读有关。
解决方案
推荐阅读
- linux-kernel - 为什么将已建立的 TCP 套接字添加到 BPF_MAP_TYPE_SOCKMAP 映射会破坏 SSL?
- wyam - 如何在 Wyam 的帖子中包含其他文件?
- python - 对文本文件中的名称进行排序,将结果写入另一个文本文件
- javascript - 为什么 Stripe 的 handleCardPayment 不在我的 Javascript 函数中运行?
- scala - 函数接受两个 List[Int] 参数并产生一个 List[Int]。斯卡拉
- javascript - 在 JavaScript 中编写切换 2 状态代码的更好方法是什么?
- pyspark - 无法在 Google Colab 上安装 PySpark
- php - 服务器 api 没有响应 Curl 函数
- laravel - 数据无效时Laravel请求验证404
- json - 使用参数 Swift 从 URL 获取数据