首页 > 解决方案 > 如何在 apify 中使用代理和基本爬虫

问题描述

我在 apify 中使用基本爬虫,如何使用代理。基本爬虫中没有代理选项或有其他使用代理的方法?

标签: apify

解决方案


基本爬虫基本上只是一个爬虫框架,没有自己的资源请求能力,所以如果你想确定使用它,那么你需要从handleRequestFunction使用 Node.js 的一些 3rd 方请求库中手动执行请求。然后您可以在库选项中指定代理。

如您所见,与其他爬虫不同,基本爬虫选项中没有代理配置:https ://sdk.apify.com/docs/typedefs/basic-crawler-options

如果您希望它自己执行请求,您可以使用另一个爬虫,并且您可以在爬虫的选项中指定代理:

https://sdk.apify.com/docs/api/cheerio-crawler

https://sdk.apify.com/docs/api/puppeteer-crawler


推荐阅读