首页 > 解决方案 > 使用 Python 将数据从 CSV 和 PDF 复制到 HDF5

问题描述

如何使用 python 将文件从特定文件夹传输到 hdf5 文件类型?文件类型为 PDF 和 CSV。例如,我有这个/root/Desktop/mal/ex1/包含许多 CSV 文件和 PDF 文件的路径,我不会让 1 个单独的 hdf5 文件包含所有这些 CSV 和 PDF 文件。

标签: pythonpython-3.xhdf5

解决方案


您可以根据您的需求详细信息修改以下代码:

import numpy as np
import h5py
import pandas as pd
import glob

yourpath = '/root/Desktop/mal/ex1'
all_files = glob.glob(yourpath + "/*.csv")

li = []

for filename in all_files:
    df = pd.read_csv(filename,index_col=None, header=0)
    li.append(df)

frame = pd.concat(li, axis=0, ignore_index=True)

hf = h5py.File('data.h5', 'w')
hf.create_dataset('dataset_1', data=frame)
hf.close()

推荐阅读