每天开心一点

Python使用正则表达式

2020-09-19 11:13:00    六月    610    来源: https://www.runoob.com/python/python-reg-expressions.html

正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。

由于正则表达式常用于操作字符串的,我们从最常见的就是字符匹配。

元字符的完整列表: .   ^   $   *   +   ?   { }   [ ]   \   |   ( )

re 模块使 Python 语言拥有全部的正则表达式功能。

常用函数:

1、re.match

re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。

2、re.search

re.search 扫描整个字符串并返回第一个成功的匹配。

3、re.sub

Python 的re模块提供了re.sub用于替换字符串中的匹配项。

4、re.compile

compile用于编译正则表达式,生成一个正则表达式(Pattern)对象,供 match() 和 search() 这两个函数使用。

5、findall

在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。

注意: match 和 search 是匹配一次 findall 匹配所有。

6、re.finditer

和 findall 类似,在字符串中找到正则表达式所匹配的所有子串,并把它们作为一个迭代器返回。

7、re.split

split 方法按照能够匹配的子串将字符串分割后返回列表。

Python中正则表达式的使用:

1、直接使用re对象的match,search,findall,finditer等方法

2、使用re.compile生成正则表达式对象,调用正则表达式对象的match,search,findall,finditer等方法

正则表达式修饰符:

re.I 使匹配对大小写不敏感

re.L 做本地化识别(locale-aware)匹配

re.M 多行匹配,影响 ^ 和 $

re.S 使 . 匹配包括换行在内的所有字符

re.U 根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.

re.X 该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。