python - 脸书刮刀
问题描述
我正在尝试从这个 facebook 个人资料中抓取帖子和图片;https://www.facebook.com/carlostablanteoficial并在尝试使用此代码到达实际帖子文本时一无所获:
from urllib.request import urlopen
import requests
from bs4 import BeautifulSoup
html = urlopen("https://www.facebook.com/carlostablanteoficial")
res = BeautifulSoup(html.read(),"html5lib");
resdiv = res.div
post = resdiv.findAll('div', class_='text_exposed_root')
print(post)
解决方案
这将返回许多结果:
import requests
from bs4 import BeautifulSoup
data = requests.get("https://www.facebook.com/carlostablanteoficial")
soup = BeautifulSoup(data.text, 'html.parser')
for div in soup.find_all('div'):
print(div)
要搜索特定类,请将循环更改为:
for div in soup.find_all('div', {'class', 'text_exposed_root'}):
print(div)
但是当我尝试时它什么也没返回,这意味着页面上没有该类的 div
推荐阅读
- javascript - 除了使用 Axios 和 NodeJS 的文件之外,FormData 不会附加其他变量
- javascript - Javascript 无法在刷新时立即从 getElementById 读取值
- python - 使用 windowsapi reloader 重启
- powerbi - 星型模式的断开连接表中过滤器的奇怪行为
- python-3.x - Python:尝试删除生成以发送电子邮件附件的文件时出错
- ios - Xcode 12.2 中禁用了运行按钮
- python - ABAQUS中的节点位移使用python脚本
- azure-data-factory - azure 数据工厂复制活动仅选择前 100 个文件
- java - Maven 无法从本地存储库 (nexus) 下载某些依赖项或插件
- javascript - 无法在 macOS 中运行 odoo 10