beautifulsoup - BeautifulSoup 输出格式错误:空格太多
问题描述
对于大部分输出,以下代码异常地打印出过多的空白。
import bs4
import requests
res = requests.get('https://www.sportsbookreview.com/forum/search.php?do=finduser&userid=126807&contenttype=vBForum_Post&showposts=1')
soup = bs4.BeautifulSoup(res.text, 'lxml')
print(soup)
这是格式成为问题的输出部分:
Sportsbooks & The Industry Service Plays / " > N e w b i e F o r u m / a > / l i >
美化不会改变任何东西。知道为什么会这样吗?
解决方案
如果您检查网站的源代码,您会看到它周围有空格(右键单击网页并单击“显示页面源”)
我运行您的代码,它打印时没有换行符和空格。
你可以做类似的事情
import bs4
import requests
res = requests.get('https://www.sportsbookreview.com/forum/search.php?do=finduser&userid=126807&contenttype=vBForum_Post&showposts=1')
soup = bs4.BeautifulSoup(res.text, 'lxml')
print(soup.prettify())
推荐阅读
- android - 为什么通知 PendingIntent 不起作用?
- ios - Xcode 模拟器没有显示 swift ui 占位符文本
- vb.net - VB.NET/Access - 检查每行的第一个值是否小于特定值,然后将文本添加到数据表中的每个对应行
- java - 如何根据单选按钮的选择显示/隐藏文本字段?
- regex - 什么是与 $ 元字符相关的“字符串结尾换行符”?
- java - 更改 JSF SessionScoped Bean 的值以注销用户
- java - 将文件从资产复制到内部存储
- vba - VBA在循环中组合列堆栈
- flutter - 我如何在颤动中制作自定义开关按钮?
- linux - 在 bash 脚本中使用 for 循环在多行命令中插入行