首页 > 解决方案 > 访问在python bs中通过url传递的变量

问题描述

我正在抓取一个网站,但遇到了一个我无法弄清楚的问题。

我从网站上提取了以下数据:

```
   tmp = ['/gourl/2aae9bb244631cf75ac56f4f61384c2dcda0d0e9?redirect=http%3A%2F%2Fwww.facebook.com%2F234343435'] 
```

如何保存 ?redirect 的结果。

我试过这个:

    ```
link = re.search("?redirect=", tmp)
    ```

它不起作用。

标签: pythonweb-scraping

解决方案


# python3

import urllib.parse

tmp = [
    "/gourl/2aae9bb244631cf75ac56f4f61384c2dcda0d0e9?redirect=http%3A%2F%2Fwww.facebook.com%2F234343435"
]

for el in tmp:
    url = el.split("?redirect=")[1]
    url_decoded = urllib.parse.unquote(url)
    print(url_decoded)

结果: http://www.facebook.com/234343435


推荐阅读