python - 在没有 PhantomJS 的 AWS Lambda 中运行 Beautiful Soup
问题描述
虽然有 5 分钟的限制,但我希望使用 AWS Lambda 和 Beautiful Soup 运行一些小型抓取项目。
以前我总是使用 EC2 和 PhantomJS 来完成这项工作。现在 PhantomJS 已被弃用,并且无论如何都不能在 Python lambda 容器上工作。我正在寻找可能使用 Chrome 或 Firefox 的替代解决方案。此外,它会在两次刮擦之间在 EC2 上留下巨大的资源浪费。因此,也可以通过一些自动化来看待 Lambda。
只是添加 Firefox 或 Chrome Python 模块(将 PhantomJS 替换为浏览器)还是需要构建 Chrome 二进制文件?
解决方案
推荐阅读
- android - 血氧水平spo2传感器
- c - 在 C 中使用 Makefile (make: *** No rule to make target .. 需要 ... Stop
- libreoffice-calc - LibreCalc 的 StarBasic 宏中的换行符“_”在带引号的字符串中不起作用
- reactjs - 未找到模块:无法在“A:\react\react-app\src”中解决“firebase”
- mqtt - MQTT Mosquitto:有没有办法在将主题发布的数据发送给所有订阅者之前对其进行预处理?(即中间件)
- mongodb - 酿造服务。无法启动服务。得到“引导失败:5:输入/输出错误”
- python - 导入运算符时出错 (Python)
- c# - List<> 项目值更改事件
- python - 在 discord.py 中 ping 一个角色
- google-cloud-platform - 如何通过api导入知识库?