python数据挖掘第一篇:正则表达式
正则表达式 re 模块 re.match(pattern,string[,flag]) match方法 从首字母开始匹配,如果包含pattern字符串,则匹配成功,返回match对象,失败则返回None. 【注】只从起始位置开始匹配 ,flag表示可选项 re.I 使匹配对大小写不敏感 re.L 做本地化识别(locale-aware)匹配 re.M 多行匹配,影响 ^ 和 $ re.S 使 . 匹配包括换行在内的所有字符 re.U 根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B. re.X 该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。 print(re.match('www', 'www.runoob.com').span()) # 在起始位置匹配 运行结果:(0,3) re.search(pattern,string[,flag]) search方法不一定从起始位置开始匹配 【注】如果存在多个匹配对象,只返回第一个 re.findall(pattern,string[,flag]) 返回所有匹配到的pattern,返回形式为数组 re.sub(pattern,repl,string) #做替换,删除 pattern = re.compile(pattern_str) # 返回一个正则表达式对象 res = pattern