首页 > 解决方案 > Blue Prism - Application Modeller:Web Scraping 的独特属性

问题描述

我是 Blue Prism 和 Web 抓取的新手。我想在标题下抓取项目列表。标题不会改变,但列表中的项目会改变。

例子:

会员列表
Charles Schwab
TD Ameritrade

列出更改

会员列表
Well Fargo
TD Ameritrade

那么如何确保列表的应用程序建模器中的属性始终能够抓取列表中不断变化的项目呢?

我注意到一些属性,例如
标签名称 = UI
path=/HTML/BODY(1)/SGX-HEADER(1)/HTML/BODY(1)/DIV(1)/MAIN(1)/DIV(1)/ARTICLE( 1)/TEMPLATE-BASE(1)/DIV(1)/DIV(1)/SECTION(1)/DIV(1)/SGX-WIDGETS-WRAPPER(1)/WIDGET-RICH-TEXT(5)/UL( 1)

这些属性是什么意思?谢谢

标签: htmlscreen-scraping

解决方案


您可以将属性创建为动态的,并在从应用程序读取它之前验证它是否存在。一旦你的应用建模器设置好了,它看起来就像

path=/HTML/BODY(1)/SGX-HEADER(1)/HTML/BODY(1)/DIV(1)/MAIN(1)/DIV(1)/ARTICLE(1)/TEMPLATE-BASE(1)/DIV(1)/DIV(1)/SECTION(1)/DIV(1)/SGX-WIDGETS-WRAPPER(1)/WIDGET-RICH-TEXT(5)/UL(1)

将此字段设置为动态。在运行时,您的流程如下所示:

这就是流程的样子,检查它是否存在,然后在集合中腾出空间并读取存在的元素路径中的值。等待阶段如下所示:

在此处输入图像描述

所以流程很简单,动态变量跟踪元素的存在,一旦它存在由等待阶段确认,然后读取该路径值处的内容并重复,直到没有更多元素存在并输出集合作为结果。


推荐阅读