1.什么是正则表达式
正则表达式(regular expression)是一种用于匹配文本形式的强大逻辑表示,在Python中的re模组提供了正则表达式的支持。
正则表达式由一些普通字符和一些元字符(meta characters)组成。普通字符包括大小写的字母和数字,而元字符则具有特殊含义。
当正则表达式为一个普通的字符串时,一个正则表达式的匹配行为就是一个普通的字符串查找过程,如正则表达式“testing”中没有包含任何元字符,它可以匹配“testing”和“testing123”等字符串,但因为大小写敏感,它不能匹配“Testing”。其他一些元字符则不会被作为普通字符来处理,它们包括 . ^ $ + ? { [ ] \ | ( ) 。
. | 匹配除了换行以外的任何字符 |
\w | 等价于[a-zA-Z0-9_]会匹配单一字母、数字或下划线字符,而\W则会匹配任何非字母、数字和下划线的单一字符 |
\b | 匹配“单一字母、数字或下划线字符”和“任何非字母、数字和下划线的单一字符” |
\s | 等价于 [ \n\r\t\f],会匹配一个空白字符(包括空格、换行、返回、制表符、表格),\s则会匹配所有非空白字符 |
\t | 匹配制表符 |
\n | 匹配换行符 |
\r | 匹配返回符 |
\d | 等价于[0-9]用于匹配十进制表示的数字 |
^作为开始标记,$作为结束标记,分别用于标记一个字符串的开始和结束的位置。 \ 用于一些字符的转移,比如 \. 表示对于一个真实点字符的匹配, \\ 表示对一个真实反斜杠字符的匹配等。如果对不是很确定一些字符是否需要进行转义才能匹配,大可都加上斜杠,比如对于 @ ,写成\@是一定没有问题的。
2.正则表达式查找
import re
str = 'A cute word:cat!!'
match=re.search(r'word:\w\w\w',str)
if match:
print('found',match.group())
结果为
3.基础正则使用
import re
print(re.search(r'..g','piiig').group())
print(re.search(r'\d\d\d','p123g').group())
print(re.search(r'\w\w\w','@@abcd!!').group())
结果如右
4.正则表达式重复
5.正确的正则表达式
1
6.正则里的方括号
1
7.正则提取
1
8.正则表达式的调试
1
9.查找所有方法
1
10.在文件中查找
1
11.选项与贪心匹配
1
来源:CSDN
作者:奇跡の山
链接:https://blog.csdn.net/qq_35812205/article/details/104113146