python - 使用 Python 将数据从 CSV 和 PDF 复制到 HDF5
问题描述
如何使用 python 将文件从特定文件夹传输到 hdf5 文件类型?文件类型为 PDF 和 CSV。例如,我有这个/root/Desktop/mal/ex1/
包含许多 CSV 文件和 PDF 文件的路径,我不会让 1 个单独的 hdf5 文件包含所有这些 CSV 和 PDF 文件。
解决方案
您可以根据您的需求详细信息修改以下代码:
import numpy as np
import h5py
import pandas as pd
import glob
yourpath = '/root/Desktop/mal/ex1'
all_files = glob.glob(yourpath + "/*.csv")
li = []
for filename in all_files:
df = pd.read_csv(filename,index_col=None, header=0)
li.append(df)
frame = pd.concat(li, axis=0, ignore_index=True)
hf = h5py.File('data.h5', 'w')
hf.create_dataset('dataset_1', data=frame)
hf.close()
推荐阅读
- arrays - 使用 PIL 中的 fromarray 保存一个 4 通道的图像向量,然后重新读取它
- html - 在 div 中创建 2 个 div 共享空间
- sulu - Sulu:如何为网络空间添加额外的菜单?
- typescript - 类型映射返回联合的类型映射成员的交集
- javascript - 根据 if 语句的位置检查复选框。js
- android-studio - 如何在 Android Studio 3.2 上查看实际的位图?
- java - 在循环内生成数字
- java - Mysql - JPA 没有插入到第三表多对多
- angular - npm-在“...serify”:“latest”,“cha”附近解析时JSON输入意外结束
- c++ - 如何在没有数学库的情况下在 C++ 中创建复利公式?