老猿在分析《 Python正则表达式\W+和\W*匹配过程的深入分析 》中的问题时,想到一个问题,如果“re.split(’(\W*)’,‘Hello,world’)”的处理如果换成非贪婪模式会怎么样,根据老猿的预测,由于在’Hello,world’中没有连续的非单词字符,因此贪婪模式处理和非贪婪模式结果应该一样,如是测试了一下看看效果: >>> re.split('(\W*)','Hello,world') #贪婪模式 ['', '', 'H', '', 'e', '', 'l', '', 'l', '', 'o', ',', '', '', 'w', '', 'o', '', 'r', '', 'l', '', 'd', '', ''] >>> re.split('(\W*?)','Hello,world') #非贪婪模式 ['Hello,world'] >>> 看到这结果老猿完全懵圈了,这完全推翻了《 Python正则表达式\W+和\W*匹配过程的深入分析 》的分析过程。但执行结果肯定是正常的,肯定是老猿自己的问题,大家觉得问题出在哪里呢? 不卖关子了,《 Python正则表达式\W+和\W*匹配过程的深入分析 》的分析过程应该是没有问题的,问题出在输入的问号上,半角的问号被输入成了全角问号,导致匹配不到对应的搜索文本,所以就将原串作为列表的元素整个返回了