首页 > 解决方案 > 返回不确定长度的子字符串

问题描述

我正在尝试使用 python 从格式化的文本消息中提取一个子字符串,以便返回一个日期时间,然后插入到 SQL 数据库中。我在返回日期时遇到问题,因为在此函数调用期间我不希望在它之后或之前的任何字符串。

这是文本文件的示例行(已删除识别信息):

<sms protocol="0" address="+##########" date="1557093540527" type="1" subject="null" body="Don't text and drive! &#129315;" toa="null" sc_toa="null" service_center="+##########" read="1" status="-1" locked="0" date_sent="1557093540000" sub_id="2" readable_date="May 5, 2019 5:59:00 PM" contact_name="XXXX" />

我试图在 readable_date=" 之后访问该位。在这种情况下,联系人姓名不相关,因此我理论上可以扔掉整个结尾,然后在 readable_date=" 之后进行分区,但这是相当大量的文本(4000-5000 条消息) 如果感觉必须有更好的方法,但我一直在寻找几个小时,但没有找到一个。

标签: pythonstring

解决方案


推荐阅读