首页 > 技术文章 > Python爬虫七 Re库

fu-9 2020-03-14 17:46 原文

Re库

正则表达式是用来简洁表达一组字符串的表达式
通用的字符串表达框架


语法

由字符和操作符组成


正则表达式的表示类型

  • 原生字符串(raw string类型)
  • string类型

原生字符串(不包含转义符''的字符串,原生转义字符串里的''不被解释为转义符)
原生字符串和字符串的区别是只需要在字符串前建一个r''即可
使用string类型进行表示,更为繁琐,需要增加一个(即\)来表示原来的正则表达式的\


常用操作符


经典正则表达式


匹配 IP的正则表达式


主要功能函数

re.search()

re.match()

re.findall()

re.split()

re.finditer()

re.sub()

使用方法


match对象
属性:

常用方法:


匹配原则
re库默认贪婪匹配

最小匹配

推荐阅读