python - 不一致的结果美丽的汤?
问题描述
所以,我正在抓取一个网站,虽然我能够返回网页的 html,但漂亮的“查找”结果却不一致。在一遍又一遍地运行检索同一页面时,BS4 有时可以找到某个标签,有时却找不到。
我测试了网页 len,当 Beautiful soup 能够检索到想要的标签时,len 是 9220189(正确尺寸),当它不能时,是 103557968。我打印了两种尺寸的网页,它们是一致的。事实上,我正在寻找的字符串可以在两个网页打印中找到。
这可能是美汤的大小限制吗?我不确定发生了什么事?
编辑:链接: https ://www.brenda-enzymes.org/ligand.php?brenda_ligand_id=1
我在找什么:soup.find(string='Molecular Formula')
有时可以找到该字符串,有时却找不到。文本始终在网页中,并且没有使用 javascript 加载。
解决方案
我通过减小 html 的大小解决了这个问题。虽然我没有找到更好的解决方案,但必须这样做。
推荐阅读
- r - glm() 中的公式顺序改变结果
- php - SQL 数组按行显示,无需 SQL 查询
- javascript - 在 csv 文件中运行 nodeJS 函数
- swift - 位置管理器在 gmsMapView swift 4.2 中显示错误位置
- java - 如何检查泛型类的反射类型
- python-3.x - CFFI 编译带有依赖项的 libpango?(泰国/弗里比迪/达特里)
- python - 允许程序取最近时间值的函数
- ios - 在 iOS 应用 Xcode 中连接 AWS RDS 和服务器实例
- scala - 如何从scala数据框中的日期列值中检索月份?
- mysql - mySQL加载数据本地infile错误号导入操作