首页 > 解决方案 > 使用 python 从 Azure blob 读取 Json 文件?

问题描述

我需要从 Azure 中的 blob 容器读取 JSON 文件,以便在 JSON 文件之上进行一些转换。我看过很少的文档和 StackOverflow 的答案,并开发了一个 python 代码来从 blob 中读取文件。

我已经从 Stackoverflow 答案之一尝试了以下脚本来读取 JSON 文件,但出现以下错误

“TypeError:JSON 对象必须是 str、字节或字节数组,而不是 BytesIO”

我是 python 编程的新手,所以不确定代码中的问题。我尝试使用 download_stream.content_as_text() 但文件没有读取文件而没有任何错误。

from azure.storage.blob import BlobServiceClient, BlobClient, ContainerClient
from io import BytesIO
import requests
from pandas import json_normalize
import json

filename = "sample.json"

container_name="test"
constr = ""

blob_service_client = BlobServiceClient.from_connection_string(constr)
container_client=blob_service_client.get_container_client(container_name)
blob_client = container_client.get_blob_client(filename)
streamdownloader=blob_client.download_blob()

stream = BytesIO()
streamdownloader.download_to_stream(stream)
# with open(stream) as j:
#      contents = json.loads(j)
fileReader = json.loads(stream)

print(filereader)

标签: pythonjsonazure-blob-storage

解决方案


你可以使用readall函数。请尝试以下代码:

from azure.storage.blob import BlobServiceClient, BlobClient, ContainerClient
import json

filename = "sample.json"

container_name="test"
constr = ""

blob_service_client = BlobServiceClient.from_connection_string(constr)
container_client = blob_service_client.get_container_client(container_name)
blob_client = container_client.get_blob_client(filename)
streamdownloader = blob_client.download_blob()

fileReader = json.loads(streamdownloader.readall())
print(fileReader)

结果: 在此处输入图像描述


推荐阅读