python - 使用python将xml数据转储到csv文件中的单元格中
问题描述
我有一个 XML 数据,其中还包含 HTML 数据。我正在尝试将此 XML 数据转储到 csv 文件中的一个单元格,该文件还包含其他列。现在,它正在分裂自己并进入不同的(相邻的)单元格。因此使用 pandas 读取 csv 会引发错误
标记数据时出错。C 错误:预计第 3 行中有 94 个字段,看到 221
我也研究了类似的情况。但它没有帮助,因为它来自数据库。因此,解决方法功能将有所不同。
我不想解析 XML 数据。我只想将整个 XML 数据保存到 csv 文件中的一个单元格中。
此外,出于保密原因,我不能分享数据快照,但我希望能传达这个问题。
任何帮助表示赞赏。
解决方案
您可以使用内置的 csv 包,尝试将 xml 包装为列表中的字符串:
import csv
xml = ["""<?xml version="1.0"?>
<catalog>
<book id="bk101">
<author>Gambardella, Matthew</author>
<title>XML Developer's Guide</title>
<genre>Computer</genre>
<price>44.95</price>
<publish_date>2000-10-01</publish_date>
<description>An in-depth look at creating applications
with XML.</description>
</book>
</catalog>"""]
with open("test.csv", "w", encoding="utf8") as out_file:
writer = csv.writer(out_file)
writer.writerow(xml)
然后,您应该可以使用 pandas 阅读它。
推荐阅读
- php - laravel 8 返回连接到 tcp://mail.infomaniak.com:465 Timed Out
- php - 即使成功后,ajax成功调用执行else条件
- python - 使用马尔可夫链将RGB图像转换为黑白(0-1)
- javascript - 如何以角度传递 Javascript 变量(JSON 数据)以在表中加载动态数据
- asp.net-core - .Net5 vs .Net Core 3 我应该选择哪一个作为目标
- xml - 增加 Tab 和 TabLayout 之间的间隙
- c# - 将“MM/yy”转换为日期时间c#
- ios - 日期格式无法正常工作 - 字符串到日期的转换
- processing - 如何在两个类之间进行碰撞?
- python - 是否可以在 Libreoffice Calc 中使用 Selenium WebDriver?