首页 > 解决方案 > 如何使用python将文本转换为xml?

问题描述

我想用 python 或 Java 将文本文件转换为 xml 文件,

我的文字:

“咖啡馆是一个地方,咖啡馆有地址和营业时间”

我的目标是生成一个文件 xml 描述文本中的所有实体

标签: xmltext

解决方案


您需要更具体地了解您使用 xml 的目标,以获得有关您的问题的最佳帮助。你可以用多种方式解释它,留下许多可能的解决方案有待讨论。

  • 您是否想要一段始终将 .txt 转换为 .xml 的代码?(难的)
  • 您是否只想转换这一行,这样可以吗?(简单的)
  • 您是否在例如 Jdeveloper 中寻找一个选项来上传 .txt 并将其更改为 .xml 以进行进一步处理(简单但具体)。

无论您出于何种目的寻找答案,.txt 文件中文本的结构方式都非常重要。如果它的结构像一个句子(如您的示例中所示),则很难为其编写一些通用代码。但是,如果它类似于这样,或者您可以以如下方式准备 .txt 文件:

1: 
Make········Model····Year····Mileage
2: 
BMW·········R1150RS··2004····14274··
3: 
Kawasaki····GPz1100··1996····60234··

然后它实际上将相当容易。转换格式通常是调整数据结构的问题。上面的例子我取自 Quora 上的以下问题。我相信该链接对您的事业非常有帮助!

.txt 上的文本墙到 quora 上的 .xml

祝你的目标好运!

杰斯珀

编辑:作为对您评论的回应。实际上字符串很难转换成表格,除非字符串总是包含某些特征。“咖啡馆是一个地方,咖啡馆有地址和营业时间”确实很笼统。如果下一句是:“Pool 是一个地方,Pool 有地址和营业时间”。您可以编写一个子字符串函数( http://www.xsltfunctions.com/xsl/fn_substring.html,用于 xslt 中的子字符串),该函数接受一个句子并将其从字符串中重复出现的实体之后的可用信息中剥离。但是,最好使用我上面的示例,并以比句子更容易转换的方式格式化您的 .txt 数据,例如逗号分隔文件。

Cafe, Pool, Library, School, Gym, Work,
Place, Adress, Opening Hours,

推荐阅读