python - 使用 np.memmap 读取数据流
问题描述
我有一个非常大的字节数据文件,当我使用时,np.memmap
我会用完资源来读取文件,我也无法使用fp.read
. 我想到的解决方案是使用以下代码流式传输文件,
with open(filename, mode='rb') as fp:
while True:
chunk = fp.read(1024)
int_chunk = numpy.fromfile(chunk, dtype=numpy.int16)
if not chunk:
break
但是,当我这样做时,我收到以下错误,
UnicodeDecodeError: 'utf-8' codec can't decode btye 0xff in position 68: invalid start byte
我不确定如何同时蒸汽和转换数据。任何想法或解决方法表示赞赏!
解决方案
推荐阅读
- sql - 错误:对表“r”的 FROM 子句条目的引用无效
- javascript - How to create new keys and properties of object based on [values] ? - JavaScript
- php - Php implementation for GMAIL API - filtering using multiple strings
- sql - ROWNUM as a pseudo column equivalent in T-SQL?
- c++ - 在 Google 测试中没有模拟的 EXPECT_CALL
- python - Python中的文本关联
- python - 带有生成器的大型语料库上的 TfidfVectorizer
- bash - Bash multiple pipes and background in last, get status code of the first one
- docker - 使用 Docker 跨多台机器设置 Elasticsearch 集群
- php - 在 p 标签内回显 php 变量,在 p 标签外返回