首页 > 解决方案 > 在 Python 中使用 Beautiful Soup 但获取部分源代码/仅源代码的结尾部分

问题描述

所以我是 BeautifulSoup 的新手,我一直在寻找不同的信息来源以了解更多信息并找到解决方案,但我被困住了。我试图从这个维基百科站点提取源代码,但我只得到了源代码的一部分,只有最后三分之一左右......因此,我错过了源代码的前 2/3 . 不知道我做错了什么。这是我在 Python 中使用的代码:

from bs4 import BeautifulSoup
import requests

corpus_codigo = requests.get("https://es.wiktionary.org/wiki/Wikcionario:Frecuentes-(1-1000)-Subt%C3%ADtulos_de_pel%C3%ADculas").text

corpus_soup = BeautifulSoup(corpus_codigo, features = 'lxml')

print(corpus_soup.prettify())

我只得到第 7042 到 7225 行......所以实际上我错过了超过 2/3 的内容,因为我已经详细看到了......有什么建议吗?

标签: pythonparsingbeautifulsoup

解决方案


推荐阅读