python - 在 Python 中使用 Beautiful Soup 但获取部分源代码/仅源代码的结尾部分
问题描述
所以我是 BeautifulSoup 的新手,我一直在寻找不同的信息来源以了解更多信息并找到解决方案,但我被困住了。我试图从这个维基百科站点提取源代码,但我只得到了源代码的一部分,只有最后三分之一左右......因此,我错过了源代码的前 2/3 . 不知道我做错了什么。这是我在 Python 中使用的代码:
from bs4 import BeautifulSoup
import requests
corpus_codigo = requests.get("https://es.wiktionary.org/wiki/Wikcionario:Frecuentes-(1-1000)-Subt%C3%ADtulos_de_pel%C3%ADculas").text
corpus_soup = BeautifulSoup(corpus_codigo, features = 'lxml')
print(corpus_soup.prettify())
我只得到第 7042 到 7225 行......所以实际上我错过了超过 2/3 的内容,因为我已经详细看到了......有什么建议吗?
解决方案
推荐阅读
- outlook - 如何在 Outlook C# 中枚举自定义用户属性的值
- google-ads-api - 如何向未关联的 MCC 帐户授予 OAuth 访问权限?
- swift - 在基于视图的 NSTableView 中拖放问题
- excel - 我想在我的个人宏工作簿中自动运行一个宏
- php - 在 jquery 循环中捕获 jiax 请求的结尾
- android - 由于清单合并,Gradle 同步失败
- java - 使用 SunEC 提供程序的 generateKeyPair 时出现运行时异常
- sql-server - 消除 SQL Server 上冗余唯一索引的唯一性是否有好处?
- excel - 在大型工作簿中单独循环遍历每一列
- linux - 计算字数并指定行数