python - Pandas DataFrame 因 AttributeError 失败:“NoneType”对象没有属性“键”
问题描述
从字典列表创建熊猫数据框失败
AttributeError:“NoneType”对象没有属性“键”
我有超过 4000K 的 json 文件,每个文件包含 1 行以下格式的 json -
{“title”:“abcWebhome”,“creator”:“demo”,“url”:“https://demo.demo.xyz/bin/bin/Gamma/”,“body”:“#REDIRECT [[Gamma ]]”,“display_title”:“Gamma”,“last_modifier”:“user1”,“modification_date”:1450340923000,“creation_date”:1450340923000,“size”:“262”,“view_count”:0,“category_list”: [],“组列表”:[]}
我需要将这些文件合并到 10 个 json 文件中,我想为这些文件处理一定数量的文件并将数据附加到列表中,创建一个 pandas 数据帧并使用 df.to_json 将其写入 json。我在大约 30 个文件上测试了代码,它运行良好。
file_list = glob.glob("*.json")
allFilesDict = {v:k for v, k in enumerate(file_list, 1)}
data = []
for k,v in allFilesDict.items():
if 1 <= k <= 400000:
with open(v, 'r') as d:
data.append(json.load(d))
df = pd.DataFrame(data)
df.to_json(r'/home/user1/merge/output_1.json', orient='records')
使用上面的代码,df创建失败了——
AttributeError:“NoneType”对象没有属性“键”
如何确定错误原因?
可以采取任何其他方法来处理如此大的文件并将其合并为 10 个文件。
解决方案
推荐阅读
- jquery - 使用 Blazor webassembly 在后台上传文件
- ios - iOS WKWebView 允许从本地存储附加输入文件
- mongodb - 从谷歌云存储流恢复“mongodump”备份
- java - 如何使用android中的按钮从另一个片段中打开一个片段
- javascript - 在 Javascript 中处理货币
- javascript - 在不改变状态、道具或父级的情况下反应子级渲染
- javascript - 如何通过一台 Express 服务器部署不同的 React Web 应用程序?
- python - Docker 没有保存 Scrapy 蜘蛛的输出文件
- python - 有人可以帮我理解下面的代码吗
- python - 给它空str不会退出无限期while循环