python语言之正则
目录 (一)正则表达式的构成 (三)Python正则模块之MatchObject (一)正则表达式的构成 正则表达式由两种元素组成: 字面值 普通字符和 需要转义的字符(,^,$,.,|,?,*,+,(),[],{}) 元字符(特殊意思) .:除\n外的所有字符 \d:数字,等同于[0-9] \D:匹配所有非数字 [ ^ 0-9] \s:空白字符,\t\r\n\f\v \S:非空白字符[ ^\t\r\n\f\v] \w:字母数字字符[A-Za-z0-9_] \W:字母数字字符[ ^A-Za-z0-9_] |:yes|no +:一次或者多次 ?:一次或者0次 *:0次或者多次 {3,5}:3次到5次 {m}:m次 {m,}:最少m次 {,n}:最多n次 贪婪与非贪婪 非贪婪(两次后加?) .*? 贪婪(默认) 边界匹配 ^:行首 $:行尾 \b:单词边界 \B:非单词边界 \A:输入开头 \Z:输入结尾 (二)Python正则模块之RegexObject 模块:import re RegexObject:编译后的正则表达式对象(编译为字节码并缓存re.compile),有利于重用 findAll方法 import re text = "Tom is 8 years old. Mike is 23 years old" pattern = re.compile('\d+')