首页 > 解决方案 > Python正则表达式从字符串中提取数字

问题描述

我想用 python 从一个大的 html 文件中提取一个数字。我的想法是像这样使用正则表达式:

import re
text = 'gfgfdAAA1234ZZZuijjk'
try:
    found = re.search('AAA(.+?)ZZZ', text).group(1)
except AttributeError:
    found = ''

found

但不幸的是,我不习惯正则表达式,我无法调整这个例子来提取0,54125

(...)<div class="vk_ans vk_bk">0,54125 count id</div>(...)

有没有其他方法可以提取数字,或者有人可以帮助我使用正则表达式?

标签: pythonregex

解决方案


如果要输出0,54125(或\d+,\d+),则需要为输出设置一些条件。

从以下输入,

 (...)<div class="vk_ans vk_bk">0,54125 count id</div>(...)

如果你想提取0,54125,似乎你可以尝试几个正则表达式,如下所示,

(?<=\>)\d+,\d+

演示

或者,

(?<=\<div class=\"vk_ans vk_bk\"\>)\d+,\d+

演示

, ETC..


推荐阅读