首页 > 解决方案 > 如何从CSV文件中提取xml数据

问题描述

我有一个 CSV 文件格式: id ,name...,他的其中一行包含一个像这样的 XML 文件

<?xml version=""1.0"" encoding=""UTF-8""?><session><appUsage packageName=""com.facebook.katana"" name=""Facebook"" startTime=""1603137470472""><state name=""[]"" className=""android.widget.FrameLayout"" duration=""1639"" interactionCount=""0"" orientation=""1""/><state name=""[Facebook]"" 

我正在尝试提取 packageName 和 statTime.Howa 我能做什么?请帮忙

标签: pythonpandas

解决方案


使用 XML 解析器并提取您要查找的数据。

import xml.etree.ElementTree as ET

xml = '''<?xml version="1.0" encoding="UTF-8"?>
               <session>
                   <appUsage packageName="com.facebook.katana" name="Facebook" startTime="1603137470472">
                        <state name="[]" className="android.widget.FrameLayout" duration="1639" interactionCount="0" orientation="1"/>
                        <state name="[Facebook]"/>
                    </appUsage>
               </session>
'''
root = ET.fromstring(xml)
package_name = root.find('.//appUsage').attrib['packageName']
print(package_name)

输出

com.facebook.katana

推荐阅读