html - Blue Prism - Application Modeller:Web Scraping 的独特属性
问题描述
我是 Blue Prism 和 Web 抓取的新手。我想在标题下抓取项目列表。标题不会改变,但列表中的项目会改变。
例子:
会员列表
Charles Schwab
TD Ameritrade
列出更改
会员列表
Well Fargo
TD Ameritrade
那么如何确保列表的应用程序建模器中的属性始终能够抓取列表中不断变化的项目呢?
我注意到一些属性,例如
标签名称 = UI
path=/HTML/BODY(1)/SGX-HEADER(1)/HTML/BODY(1)/DIV(1)/MAIN(1)/DIV(1)/ARTICLE( 1)/TEMPLATE-BASE(1)/DIV(1)/DIV(1)/SECTION(1)/DIV(1)/SGX-WIDGETS-WRAPPER(1)/WIDGET-RICH-TEXT(5)/UL( 1)
这些属性是什么意思?谢谢
解决方案
您可以将属性创建为动态的,并在从应用程序读取它之前验证它是否存在。一旦你的应用建模器设置好了,它看起来就像
path=/HTML/BODY(1)/SGX-HEADER(1)/HTML/BODY(1)/DIV(1)/MAIN(1)/DIV(1)/ARTICLE(1)/TEMPLATE-BASE(1)/DIV(1)/DIV(1)/SECTION(1)/DIV(1)/SGX-WIDGETS-WRAPPER(1)/WIDGET-RICH-TEXT(5)/UL(1)
将此字段设置为动态。在运行时,您的流程如下所示:
这就是流程的样子,检查它是否存在,然后在集合中腾出空间并读取存在的元素路径中的值。等待阶段如下所示:
所以流程很简单,动态变量跟踪元素的存在,一旦它存在由等待阶段确认,然后读取该路径值处的内容并重复,直到没有更多元素存在并输出集合作为结果。
推荐阅读
- visual-studio-code - 从 Visual Studio Code 部署 Azure WebJob
- typescript - 禁止通过 void/never 重载来调用 0 函数
- sql - 日期范围之间的 PostgreSQL 查询,但仅在特定时间之间
- python - 如何对存储为 Python 列表中的 numpy 数组的数字运行 for 循环
- python - 用于大型处理的 Dynamodb Stream
- python - 使用 Flask 的动态表单?
- laravel - 在 Laravel Eloquent 中,我可以在没有数据透视表的情况下定义多对多关系吗?
- mysql - 为什么使用 IN 作为子查询的一部分的 where 子句在显式完成时会返回不同的行数?
- pytorch - 张量的 Pytorch 成对串联
- azure - 如何使用 Whitesource API 将 Whitesource Report 集成到 Azure Dashboards