首页 > 解决方案 > 找到没有漂亮汤的 html 正文?

问题描述

我一直试图找到有漂亮汤的东西
但现在我很想找到没有漂亮汤的东西

使用重新编译方法我应该如何找到

重新进口

</head>  
<body>
<a href="https://programmers.co.kr/learn/courses/4673"></a>#!MuziMuzi!)jayg07con&&

</body>

我试过了

re.findall('<body>(.*?)</body>', html, re.DOTALL)

但什么也找不到

标签: pythonregexrecompile

解决方案


如果必须,它似乎可能只是缺少r

import re

exp = """

</head>  
<body>
<a href="https://programmers.co.kr/learn/courses/4673"></a>#!MuziMuzi!)jayg07con&&

</body>
"""

print(re.findall(r"<body>(.*?)</body>", exp ,re.DOTALL))

输出

['\n<a href="https://programmers.co.kr/learn/courses/4673"></a>#!MuziMuzi!)jayg07con&&\n\n']

推荐阅读