python - Python Pandas 数据框 XML
问题描述
我对python相当陌生,正在寻找有关我的python代码的一些指导。我有多个 XML 文件,我想将它们放入一个数据框中。每个 XML 文件是一个记录。我下面的代码将数据放入多个数据框中,但我试图找到一种解决方案将行附加到一个数据框中。任何帮助是极大的赞赏!
这是我现有的代码
from bs4 import BeautifulSoup
import lxml
import pandas as pd
import os
import xml.etree.ElementTree as et
path = '/app/notebooks'
for filename in os.listdir(path):
if filename.endswith('.xml'):
fullname = os.path.join(path, filename)
soup = BeautifulSoup(open(fullname, "r"), "xml")
d = {}
for tag in soup.RECORDING.find_all(recursive=False):
d[tag.name] = tag.get_text(strip=True)
df = pd.DataFrame([d])
pd.set_option('display.max_columns', None)
display (pd.DataFrame(df))
解决方案
推荐阅读
- complexity-theory - 两个问题的组合的类别是什么,其中一个是 NP-Complete 问题?
- vim - 如何在 Vim 中使用键绑定运行 pandoc?
- php - PHP中的正则表达式过滤@name或@name.lastname
- c++ - 未定义符号 _stdscr 和 _wgetch
- c# - NET Core 3.1 应用程序设置中的连接字符串与 EntityFramework Core
- c# - 您不应在一个对象上多次调用 Dispose (CA2202)
- python - Python函数用data_frame中的子字符串替换字符串
- azure - 如何将 ADLS gen2 文件夹/文件名动态传递到 ADF 或 Databricks 中的 Databricks Notebook
- java - 在不改变 server.xml 或 tomcat/web.xml 的情况下添加 tomcat 监听器 LifecycleListener
- c# - C# 事件调用和同步