首页 > 技术文章 > 怎样处理python爬虫中有中文的url

yuqiangwu 2019-03-17 01:28 原文

如果URL中存在中文,而你却不对它做任何处理,他不会达到你所想的那样,因此我们需要将中文部分进行处理,要用到urllib.parse模块中的quote将中文转化成URL所需的编码,url中的中文要单独处理,不能中英文全部合在一起处理(因为一部分的特殊字符也会被处理掉)。

 

  1.  
    import urllib.parse
  2.  
     
  3.  
    word='龙'
  4.  
    word=urllib.parse.quote(word)
  5.  
    url='https://baike.baidu.com/search/word?word=%s'%word
  6.  
    print(url)

运行结果为:

推荐阅读