python - 在 pyspark 中分解简单的 XML 文件(不使用数据块)
问题描述
我有一个 XML 文件,如下所示:
<?xml version="1.0" encoding="UTF-8"?>
<items>
<item id="0001" type="donut">
<name>Cake</name>
<ppu>0.55</ppu>
<batters>
<batter id="1001">Regular</batter>
<batter id="1002">Chocolate</batter>
<batter id="1003">Blueberry</batter>
</batters>
<topping id="5001">None</topping>
<topping id="5002">Glazed</topping>
<topping id="5005">Sugar</topping>
<topping id="5006">Sprinkles</topping>
<topping id="5003">Chocolate</topping>
<topping id="5004">Maple</topping>
</item>
</items>
我怎样才能炸开面糊和浇头并将其压平成表格格式?
解决方案
推荐阅读
- r - 在 R 中将 as.factors 分组在一起
- reactjs - 被 CORS 老板打败(GraphQLServer、Graphql-yoga、React)
- google-api - 链接的应用程序页面在哪里
- html - 如何在 Bootstrap 3.4 的同一行上创建输入和按钮?
- java - GPS地图不会播种它
- php - php中shuffle中的字符串重复问题
- swift - Swift 4 解析嵌套的 JSON 数组,这是来自 Web 服务的响应
- node.js - 在 NodeJS 中格式化 Postgres 查询的输出
- r - 我可以可视化箱形图中框的“另一个变量”的平均值吗?
- ios - 使用 PDFKit IOS 保存的 PDFView 未在 Adobe 阅读器中正确显示