python-3.x - 阻止scrapy重定向到特定国家的域
问题描述
我正在尝试从 airbnb.com 中提取数据。但是,每当我尝试访问其域中包含 .com 的网站时,它都会重定向到具有 .ca 的域。
这是我认为可以描述我的问题的代码片段
In [46]: fetch(url)
2021-02-05 09:17:36 [scrapy.downloadermiddlewares.redirect] DEBUG: Redirecting (307) to <GET https://www.airbnb.ca/s/nova/homes?tab_id=home_tab&refinement_paths%5B%5D=%2Fhomes&date_picker_type=calendar&source=structured_search_input_header&search_type=search_query&locale=en&_set_bev_on_new_domain=1612519553_NTk3ZTMyZGU4NzI2> from <GET https://www.airbnb.com/s/nova/homes?tab_id=home_tab&refinement_paths[]=%2Fhomes&date_picker_type=calendar&source=structured_search_input_header&search_type=search_query>
2021-02-05 09:17:37 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.airbnb.ca/s/nova/homes?tab_id=home_tab&refinement_paths%5B%5D=%2Fhomes&date_picker_type=calendar&source=structured_search_input_header&search_type=search_query&locale=en&_set_bev_on_new_domain=1612519553_NTk3ZTMyZGU4NzI2> (referer: None)
实际上,airbnb 会为每个域名为 .com 的列表加载价格。我尝试了各种解决方案,例如 don_redirect 等,但没有收到所需的响应。
解决方案
推荐阅读
- laravel - 十月CMS和BotMan
- python - 如何在 django 视图中获取当前路径?
- javascript - 如何在没有回发的情况下运行 Jscript
- gams-math - 如何在 GAMS 中写出“If for all I>=2 a(I) =b(I) then x=x+3”?
- html - React 应用程序中的锚链接适用于桌面和所有 android 浏览器,但不适用于 iOS 设备
- c# - X509Certificate2 与使用 SHA256withRSA 的私钥签名数据
- python - Python:在具有有限点数的区域上近似积分
- java - 哦,不,不再 - 比较两碗矮牵牛 - 对不起 - 浮动,平等
- java - 使用 LauncherImpl.launchApplication 时无法在命令行中运行程序
- apache-spark - 在 PySpark 中的文字列上检测到 INNER 连接的笛卡尔积