首页 > 解决方案 > 如何使用 Selenium 更新 INITIAL_REDUX_STATE?

问题描述

鉴于此网站:https ://www.nike.com/w/sale-3yaep .....我目前正在使用以下行在 INITIAL_REDUX_STATE 字典中提取一些信息:

doc = requests.get('https://www.nike.com/w/sale-3yaep',verify=False).text
data = re.search(r"window\.INITIAL_REDUX_STATE=(\{.*\})", doc).group(1)
data = json.loads(data)

我的问题是这个。INITIAL_REDUX_STATE 字典仅包含第一页/默认页面上的产品数据。当您向下滚动浏览网站时,INITAL_REDUX_STATE 不会更新。我正在使用向下滚动到页面底部的 Selenium 包,并在每次滚动时提取 INITIAL REDUX STATE 字典,但同样,它不会拾取新产品。

INITIAL_REDUX_STATE 是否可以更新?或者它总是静态的?任何问题让我知道。

标签: pythonhtmlbeautifulsoup

解决方案


推荐阅读