首页 > 解决方案 > 如何使用 h5py 读取 Row Wise 而不是 column wise?

问题描述

我有一个形状为 70x10,000,000(10,000,000 列 70 行)的 matlab 文件

f = h5py.File(filepath, 'r')
item = list(f.items())[0][1]
print(item)

它将其重塑为 10,000,000x70(10,000,000 行,70 列)有没有办法保持原始形状?

标签: pythonmatlabdatasetreshapeh5py

解决方案


h5py 将 HDF5 数据作为 Numpy 数组返回。因此,使用 h5py 的关键是在需要时使用 Numpy 方法。您可以使用 轻松转置数组np.transpose()。下面提供了一个简单的示例。它创建一个包含 2 个数据集的 HDF5 文件:1) 形状为 (20,5) 的数组,以及 2) 形状为 (5,20) 的转置数组。然后它提取 2 个数组并用于np.transpose()切换行/列顺序。

with h5py.File('SO_67031436','w') as h5w:
    arr = np.arange(100.).reshape(20,5)
    h5w.create_dataset('ds_1',data=arr)
    h5w.create_dataset('ds_1t',data=np.transpose(arr))
    
with h5py.File('SO_67031436','r') as h5r:
    for name in h5r:
        print(name,',shape=',h5r[name].shape)
        arr=np.transpose(h5r[name][:])
        print('transposed shape=',arr.shape)

推荐阅读