首页 > 解决方案 > 防止 Beautiful Soup 关闭我的标签

问题描述

我用 PHP 导入页眉和页脚,在其中我关闭头部,启动和关闭正文,并关闭 html。像这样:

<html>
<head>
<?php include ('Header.php');?>
CODE
<?php include ('Footer.php');?>

美丽的汤试图通过插入标签来修复我的“破损”标签来解决这个问题。

<html>
<head>
<?php include ('Header.php');?>
</head><body> <-------------------------
CODE
<?php include ('Footer.php');?>
</body></html>  <-------------------------

我知道 Beautiful Soup 正在按预期工作,但我怎样才能删除添加的标签,或者让 Beautiful Soup 不添加它们。我已经尝试过 lxml 解析器,但它做了同样的事情。谢谢。

标签: phppythonhtmlparsingbeautifulsoup

解决方案


当你调用 BeautifulSoup 时,你选择什么解析器?

尝试使用 Python 默认解析器:

soup = BeautifulSoup(your_html, 'html.parser')

推荐阅读