首页 > 技术文章 > python解析xml字符串与xml转json

1314520xh 2022-02-03 21:08 原文

一、python解析xml字符串

from
xml.dom.minidom import parseString xml_str=""" <root> <privateKey>UAP_2oSY90</privateKey> <srcContent> </srcContent> <dataContent> <syncContent dataType="1" operType="1"> <syncUnicode>0410000043</syncUnicode> <oldContent realmId="1"> <baseInfo> <deptName text="组织机构全称">旧部门</deptName> <deptUniCode text="组织机构编码">0410000043</deptUniCode> <showNum text="排序编号">9999</showNum> <deptStatus text="组织机构状态">1</deptStatus> <isCorp text="组织机构类型" deptConfId="3">1</isCorp> </baseInfo> <parentInfo> <parentCode id="8471" text="父级组织机构唯一标识" levelCode="561G.8471G" deptName="人"> 0432000000 </parentCode> </parentInfo> </oldContent> <changeContent> </changeContent> <newContent realmId="1"> <baseInfo> <deptName text="组织机构全称">新部门</deptName> <deptUniCode text="组织机构编码">0410000043</deptUniCode> <showNum text="排序编号">9999</showNum> <deptStatus text="组织机构状态">1</deptStatus> <isCorp text="组织机构类型" deptConfId="3">1</isCorp> </baseInfo> <parentInfo> <parentCode id="8471" text="父级组织机构唯一标识" levelCode="561G.8471G" deptName="人"> 0432000000 </parentCode> </parentInfo> </newContent> </syncContent> </dataContent> </root> """ doc = parseString(xml_str) collection = doc.documentElement returnInfo = collection.getElementsByTagName("deptName")[0].childNodes[0].data # 返回的是:天 dataType=collection.getElementsByTagName("syncContent")[0].getAttribute("dataType") operType=collection.getElementsByTagName("syncContent")[0].getAttribute("operType") #返回的是:1 #获取节点名称,查找元素 for i in collection.getElementsByTagName("deptName"): print (i.childNodes[0].data) #返回:旧部门 # 新部门 oldContents = collection.getElementsByTagName("oldContent") for oldContent in oldContents: baseInfos = oldContent.getElementsByTagName('baseInfo') for baseInfo in baseInfos: baseInfo.getElementsByTagName('deptName')[0].childNodes[0].data

 

2、xml转json的函数
import json
import xmltodict
#定义xml转json的函数
xmlstr =""" <root>
                <privateKey>UAP_2oSY90</privateKey>
                <srcContent>
                </srcContent>
                <dataContent>
                    <syncContent dataType="1" operType="1">
                        <syncUnicode>0410000043</syncUnicode>
                        <oldContent realmId="1">
                            <baseInfo>
                                <deptName text="组织机构全称">旧部门</deptName>
                                <deptUniCode text="组织机构编码">0410000043</deptUniCode>
                                <showNum text="排序编号">9999</showNum>
                                <deptStatus text="组织机构状态">1</deptStatus>
                                <isCorp text="组织机构类型" deptConfId="3">1</isCorp>
                            </baseInfo>
                            <parentInfo>
                                <parentCode id="8471" text="父级组织机构唯一标识"
                                    levelCode="561G.8471G" deptName="人">
                                    0432000000
                                </parentCode>
                            </parentInfo>
                        </oldContent>
                        <changeContent>
                        </changeContent>
                        <newContent realmId="1">
                            <baseInfo>
                                <deptName text="组织机构全称">新部门</deptName>
                                <deptUniCode text="组织机构编码">0410000043</deptUniCode>
                                <showNum text="排序编号">9999</showNum>
                                <deptStatus text="组织机构状态">1</deptStatus>
                                <isCorp text="组织机构类型" deptConfId="3">1</isCorp>
                            </baseInfo>
                            <parentInfo>
                                <parentCode id="8471" text="父级组织机构唯一标识"
                                    levelCode="561G.8471G" deptName="人">
                                    0432000000
                                </parentCode>
                            </parentInfo>
                        </newContent>
                    </syncContent>
                </dataContent>
            </root>
        """
#parse是的xml解析器
xmlparse = xmltodict.parse(xmlstr)
#json库dumps()是将dict转化成json格式,loads()是将json转化成dict格式。
#dumps()方法的ident=1,格式化json
jsonstr = json.dumps(xmlparse,indent=1)
print(jsonstr)

 

推荐阅读