web-scraping - 抓取、上传和通知
问题描述
我正在制作一个应用程序,它会在外部网站上有新项目时立即向用户发送通知
目前这个过程是手动的,我自己检查更新并发送通知。然后我更新我的网站以显示新项目。
我正在尝试使用网络爬虫在我的网站上运行以提取信息并将其显示在应用程序中,但即使是手动运行的。
有什么工具可以用来自动化这个过程吗?
所以会:
定期检查外部网站的更新。
获取更改并更新我的网站 (WordPress)
向用户发送通知
解决方案
我已经自动化了类似的东西(不包括 WordPress 部分)。它也是一种用于监控新项目(出租公寓)网站的自动化:当有新公寓可用时 - 自动化会在我的手机上向我发送通知。
作为一个自动化工具,我使用了 Easybots Studio ( https://easybots.net ) - 简单、免费,具有我需要的所有开箱即用的功能,我可以编写自己的“机器人”。
1. HTML 监控
简而言之,自动化解决方案类似于:
- 15 分钟过去了
- [HTML Bot] 获取页面的 HTML
- [HTML Bot] GetAllBySelector(".someHtmlElementClass") (获取公寓列表中的所有 html 元素)
- foreach 新列表
- Pushbullet Bot. 在我的手机上发送通知
- foreach 新列表
- [HTML Bot] GetAllBySelector(".someHtmlElementClass") (获取公寓列表中的所有 html 元素)
- [HTML Bot] 获取页面的 HTML
自动化基于他们的博客条目(“监控网站以获取快速销售的剧院门票”),这在这里也可能会有所帮助。
因此,如果您走这条路,您将需要探索外部网站的 HTML,并查看项目是如何列出的。HTML bot 需要这样才能通过“SelectAllByXPath”或“GetAllBySelector”获取所有项目。
2. WordPress 自动化
至于自动化 WordPress 部分 - 我在他们的网站上找不到这样做的机器人,但你可以开发自己的应用程序(WordPress 有 REST API 可能性),或者甚至可以联系 easybots 支持以查看他们是否有这样的机器人管道。
如果您是 .Net 开发人员 - 这是使用 WordPress Rest API 的起点:https ://dev.to/yeisonpx/connecting-to-wordpress-using-c-5688
3. 发送通知
在 Easybots 中,有可用于发送电子邮件的电子邮件机器人,还有一些移动通知机器人(pushbullet、pushover 等)。在问题中没有指定需要什么样的通知,但是使用 Easybots 应该很容易。
其他工具:WinAutomation、Automation Anywhere、UiPath..
推荐阅读
- c# - I'm trying to move a Rectangle in a Canvas ( in a WPF app) using the Mouse event but it don't work
- c# - 如何隐藏密码框 wpf 的验证错误?
- java - 如何通过 Gradle 访问私有 Github 包注册表
- python - 从 panda 中提取数据,其中列最近更改为即将更改
- azure - 您如何决定 Azure 中最合适的大数据处理技术堆栈?
- python - Select a valid choice. ["objects"] is not one of the available choices. in Django
- java - 如何从 chrome 浏览器获取画布元素坐标
- arrays - A set function that does not overwrite existing values for array
- powerbi - How to change the line value according to the level of hierarchy in my chart
- java - Springboot Entity manager cannot reliably process 'persist' call