python - 找到没有漂亮汤的 html 正文?
问题描述
我一直试图找到有漂亮汤的东西
但现在我很想找到没有漂亮汤的东西
使用重新编译方法我应该如何找到
重新进口
</head>
<body>
<a href="https://programmers.co.kr/learn/courses/4673"></a>#!MuziMuzi!)jayg07con&&
</body>
我试过了
re.findall('<body>(.*?)</body>', html, re.DOTALL)
但什么也找不到
解决方案
如果必须,它似乎可能只是缺少r
:
import re
exp = """
</head>
<body>
<a href="https://programmers.co.kr/learn/courses/4673"></a>#!MuziMuzi!)jayg07con&&
</body>
"""
print(re.findall(r"<body>(.*?)</body>", exp ,re.DOTALL))
输出
['\n<a href="https://programmers.co.kr/learn/courses/4673"></a>#!MuziMuzi!)jayg07con&&\n\n']
推荐阅读
- javascript - 从图像列表生成 MediaStream (bitmap/png/jpeg)
- sql - 结果集为空时返回一个数字
- vue.js - Vuetify:节流/去抖动 v-autocomplete
- eclipse - 如何在 eclipse 4.X 应用程序中使用 eclipse 3.X 透视图
- javascript - 为什么我们需要在 ReactJS 中使用 bind() 来访问 this.props 或 this.state?
- javascript - 如何在 JS 中获取服务器日期时间?
- python - 无法在 python selenium 中访问 iframe,收到过时错误
- content-management-system - Wix:使用外部 API 调用填充中继器
- python - 装饰器的继承
- vb.net - SerialPort.ReadByte 突然返回零而不是连接电缆的版本号