python - 尝试以 json 格式对我的数据进行分析。到目前为止,我的代码如下,我的问题是如何加入我的所有数据,请帮助我是 python 新手
问题描述
这就是我到目前为止所做的
import os, json
import pandas as pd
path_to_json = 'C:\\Users\\Mohammed Al kinoon\\Desktop\\Research Data\\VCDB-master\\VCDB-master\\data\\json\\validated'
json_files = [pos_json for pos_json in os.listdir(path_to_json) if pos_json.endswith('.json')]
print(json_files)
输出 在此处输入图像描述
解决方案
对于熊猫,我推荐以下内容:
data_frames = [pd.read_json(file) for file in json_files]
combined_df = pd.concat(data_frames).reset_index(drop=True)
这假设所有文件都遵循相同的格式(列/键)并且可以放入内存中。如果它们遵循不同的格式,您应该将它们分成遵循相同格式的组。
如果它们太大而无法放入内存,我建议使用 Spark/pyspark。
推荐阅读
- reactjs - 使用 React 路由器的 Azure 静态应用程序路由配置
- kubernetes - 如何在 AKS 的 K8S 集群中强制执行 MustRunAsNonRoot 策略
- c# - 如果我想每次都更改 Referer 标头,就不能使用 GetStringAsync() 吗?
- javascript - 使用 useContext 显示错误:未定义不是对象
- php - Laravel Livewire,如何将选项标签的值发送到wire:model =“ category”?
- python-3.8 - Mypy 和海象算子
- azure-sql-database - 如何在本地服务器上(自动)备份 azure sql 数据库?
- java - 编组/取消编组时 JAXB 翻译元素名称
- python-2.7 - urllib2 中的 CERTIFICATE_VERIFY_FAILED 但不是请求,在 Python 2.7.18
- springfox - 如何使用 Springfox 2.7.0、2.9.2 将多个值设置为 defaultValue