json - Pyspark - 从多个嵌套的 Json 文件创建数据框
问题描述
我正在尝试从多个嵌套的 json 文件创建一个数据框,其中一些文件具有某些列,而另一些则没有这些列。我编写了有效的代码,但是我也需要将其推广到其他列。你能帮我么。
f1 = multiline_df.select(
["productType.mainProductTypeName", "commercialClass.commercialClassNo"]
)
if "strategicPricing" in multiline_df.columns:
df1 = multiline_df.select(
[
"productType.mainProductTypeName",
"commercialClass.commercialClassNo",
"strategicPricing.strategicPricingNameEn",
]
)
else:
df1 = df1.withColumn("strategicPricing", F.lit(None).cast(StringType()))
- 如何将以上内容概括为多列
- 如何保持条件只获取具有更多最新信息的字典数据?
[
{
"updateDate": "2021-01-04T11:24:37Z",
"deleteDate": null,
"validFrom": "2008-09-01",
"validTo": "2012-08-31",
"paNo": "0131",
"paName": "Layer glued armchairs",
"praNo": "013",
"praName": "Armchairs",
"hfbNo": "01",
"hfbName": "Living room seating"
},
{
"updateDate": "2019-07-05T16:01:10Z",
"deleteDate": null,
"validFrom": "2012-09-01",
"validTo": "2015-08-31",
"paNo": "0114",
"paName": "Armchairs..",
"praNo": "011",
"praName": "Sofas",
"hfbNo": "01",
"hfbName": "Living room seating"
}
]
解决方案
推荐阅读
- css - 如何使用 Laravel Mix 将版本号添加到路径中?
- tesseract - 为什么要使用 RecursiveParserWrapper 而不是 Parser 来从图像中提取文本?
- android - 无法使用 firebase-config:16.0.0 和 firebase-core:16.0.1 构建
- wordpress - 如何将类别的默认值添加到 wordpress 中的自定义帖子?
- html - 从输入到其他组件的Angular6数据
- css - 在 CSS 中使用标题中的特殊格式缩进
- css - 为 formGroup 禁用 ng-invalid
- apache-spark - “SHOW TABLES LIKE '*sub_string*'” 不适用于 HIVECONTEXT
- r - Quantmod:计算昨天的差距并根据用户提示选择股票
- spring-ldap - SPRING LDAP 间歇性地需要 2.10 分钟