web-crawler - 抓取 - 如何获取动态生成的内容的值?
问题描述
我正在使用Firefox firebug tool
. 这是为了抓取。我想获得动态生成的内容的价值。
我了解该网站的工作原理,但我被困在一个特定的(最终)点。需要这里有经验的人的帮助。
最终目的是获取产品的链接:-
Step1)它使用其 API 搜索产品(在搜索栏中)。这个API的输入product name
和响应是HTML内容形式的搜索结果,最后将结果显示在页面上。
Step2)为获取所选产品的链接,网站使用uniqueID
该产品的上述内容点击另一个API,response(link) 的形式为http://example.com/uniqueId/?link_id={{link_id}}
link_id
上面的响应与正确的,不是一起显示在文本框中{{link_id}}
。
在检查(使用萤火虫)文本框后,里面的内容是http://example.com/uniqueId/?link_id={{link_id}}
. 但是,当在前端看到时,它会显示http://example.com/uniqueId/?link_id=123bad3
不确定,但我觉得这类似于 Jinja 模板语言,其中{{link_id}}
是上下文变量并且是服务器填充的。
我怎样才能提取link_id
?
解决方案
据我了解,您将不得不使用某种“网络驱动程序”技术来跟踪链接以检索uniqueID
,以便您可以自己以编程方式重建链接。我不相信有任何办法解决这个问题。
推荐阅读
- android - 在放大和缩小时移动图像视图上的对象
- python - 访问 Google 表格中的数据作为对话流的数据库
- php - why replace ^m to "\n" or "" removed \t?
- node.js - Upload large files properly using AWS lambda and S3 (with existing limits)
- openebs - What are the supported backend filesystems (storage pools) for OpenEBS Jiva Volumes?
- javascript - 延迟“每个”方法
- python - Error in "from . import views" in urls.py while making migrations
- spring-batch - 如何在春季批处理中的另一个流中定义并行子流?
- imagemap - How to create image-map in jssor slider
- sd-card - Orange Pi 4g iot configuration and flash tool not working