javascript - 如何使用 Puppeteer 进行网页抓取并发布?
问题描述
我想使用 Puppeteer 进行网络抓取。当用户单击我的应用程序中的按钮时,它将从外部 URL 获取数据。我的应用程序必须访问外部 URL、填写表格、单击按钮、获取返回的数据并将其显示给我的应用程序中的用户。这是一个内部项目,起初是一个小项目。
我使用以下网站 编写了一个使用 Puppeteer 的测试代码: https ://try-puppeteer.appspot.com/
工作完美。伟大的!
但是,我无法通过 Locaweb 上的共享主机让我的代码在我的域上运行。在我看来,我依赖于服务器上的更改才能运行 Puppeteer,对吗?
是否有一个免费的地方可以托管我的代码并像我在https://try-puppeteer.appspot.com/上那样使用Puppeteer运行?如果您没有免费的建议选项,您能否建议一个可行的低成本选项?
谢谢!
解决方案
脚步:
- 您需要创建一个简单的 expressjs api。
- 在某处托管 api(有成千上万的 vps 和云托管提供商,如 digitalocean/linode 等)
- 使用前端访问该 api(通常是 ajax 调用)
确实有一些免费服务,但它们会更复杂一些。您需要了解一些无服务器功能。尝试搜索,
- AWS 拉姆达
- 网络化功能
- Firebase 函数
- 谷歌云功能
- 谷歌云运行。
推荐阅读
- javascript - AWS Cognito 身份验证返回错误 - Javascript 开发工具包
- c++ - 无法启动 OpenGL 窗口
- c++ - Visual Studio 2017 社区设置/选项未生效
- python - Python多维矩阵定义索引错误
- smartcontracts - eosio-ld 的链接问题
- javascript - 为什么 JavaScript 有 Math 对象?
- javascript - 等待javascript递归函数返回true
- android - 如何在 Android 上设置属性 android:layoutDirection 的通用值?
- javascript - 在 React 中重置控件的默认值
- angular - ASPNETZERO - 来自 Angular 4/.Net Core 的 SelectPdf ConvertUrl() 中的身份验证