python re模块
'''1. 元字符 符号 含义 . 匹配除换行以外的任意字符 ^ 匹配字符串的开始位置,在[]中出现为非的意思 $ 匹配字符串的结束位置 * 匹配0次、1次或多次前面的原子 ? 匹配0次或1次前面的原子 + 匹配1次或多次前面的原子 {n} 前面的原子恰好出现n次 {n,} 前面的原子至少出现n次 {n,m} 前面的原子至少出现n次,至多出现m次 | 模式选择符 () 模式单元符,作分组:在findall 中使用,返回的参数是()中匹配的值,不会管外面其他参数 (?:reg):取消优先级,在findall中使用,会返回满足全部正则的字符,而不是返回字符的一部分(reg是变量) (?P<name>);给分组指定name. (name是变量) [] 字符集,里面出现的字符都只表示某一个字符,不会有转义问题 eg: [a-z0-9A-Z] 数字,大小写字母中的一个 通用字符 符号 含义 \w 匹配任意一个字母、数字或下划线 \W 匹配除字符、数字和下划线以外的任意一个字符 \d 匹配任意一个十进制数 \D 匹配除十进制数以外的任意一个其它字符 \s 匹配任意一个空白字符 \S 匹配除空白字符以外的任意一个其它字符 \b:表示字母数字与非字母数字的边界, 非字母数字与字母数字的边界。 \B:表示字母数字与(非非)字母数字的边界