python-3.x - 有没有办法使用刮刀向下滚动 Instagram 页面?
问题描述
这是我编写的一个函数,用于从我的 Instagram 个人资料中抓取图像 URL。
def ImageList():
url = 'https://www.instagram.com/Username/?hl=en'
data = req.Request(url)
resp = req.urlopen(data)
respData = resp.read()
dat = re.findall(r'"src"\s*:\s*"(.+?)"', str(respData))
print(str(respData))
i = 0
rec = []
for x in dat:
if re.search("/s640x640/", x):
rec.append(x)
return rec
虽然它工作得很好,但它只返回前 9 个左右的 URL。我意识到这是因为页面本身是一个无限滚动页面,因此我需要滚动页面以加载所有图像并获取它们的 URL。
是否可以在不使用驱动程序(Selenium Webdriver)的情况下做到这一点,即为它编写我自己的代码。
我知道 Instagram 有一个 API,这里的目标是让我的代码自给自足,请不要用它来轰炸我,谢谢。
解决方案
推荐阅读
- python-3.x - 读取多个excel文件并对其应用清理过程
- r - 堆积柱形图出现而不是使用ggplot闪避
- python - 使用 smtp 从列表发送邮件
- ruby-on-rails - 为多租户 Rails 应用程序建模,使其易于维护
- ios - xcode 在上传期间在错误的路径中引用 itmsTransporter
- html - 如何从我的页面中删除一个大的空白区域?
- javascript - 在没有键的情况下循环 Map JavaScript
- java - 有没有办法从 Oracle 中选择记录并锁定它们以避免被另一个请求读取?
- java - do-while 循环计算输入数字中的位数。故障排除代码
- bash - 如何编写带有条件的嵌套 bash 循环