首页 > 解决方案 > 在 pyspark 中分解简单的 XML 文件(不使用数据块)

问题描述

我有一个 XML 文件,如下所示:

<?xml version="1.0" encoding="UTF-8"?>
<items>
    <item id="0001" type="donut">
        <name>Cake</name>
        <ppu>0.55</ppu>
        <batters>
            <batter id="1001">Regular</batter>
            <batter id="1002">Chocolate</batter>
            <batter id="1003">Blueberry</batter>
        </batters>
        <topping id="5001">None</topping>
        <topping id="5002">Glazed</topping>
        <topping id="5005">Sugar</topping>
        <topping id="5006">Sprinkles</topping>
        <topping id="5003">Chocolate</topping>
        <topping id="5004">Maple</topping>
    </item>
</items>

我怎样才能炸开面糊和浇头并将其压平成表格格式?

标签: pythonxmlapache-sparkpysparkapache-spark-xml

解决方案


推荐阅读