推荐|Python正则表达式re.findall("[A-Za-z]([A-Za-z0-9])*[.]txt",'Abc2019.txt')的结果为什么是['9']

在《Python妙用re.sub分析正则表达式匹配过程》中老猿分析了findall函数的返回情况，老猿前一阵子在执行这个语句时：

>>> re.findall("[A-Za-z]([A-Za-z0-9])*[.]txt",'Abc2019.txt')
['9']
>>>
1
2
3

没有弄明白为什么是这个结果，我们使用《Python妙用re.sub分析正则表达式匹配过程》介绍的方法parsematch来分析一下：

>>> parsematch("[A-Za-z]([A-Za-z0-9])*[.]txt",'Abc2019.txt')
第1次匹配，匹配情况:
    匹配子串group(0): Abc2019.txt,位置为：(0, 11)
    匹配子串group(1): 9,位置为：(6, 7)
>>>

1
2
3
4
5
6

结合《Python正则表达式re.findall一个有趣的现象》我们知道这个返回确实是符合《Python正则表达式re.findall一个有趣的现象》的分析的。
但为什么group（1）是“9”呢？这是因为重复匹配的描述符“*”是对组“([A-Za-z0-9])”的限定，由于“*”是贪婪的，因此组匹配到一个字符后会继续往下匹配，直到遇到小数点之前才终止，因此group（1）最终的匹配结果是‘9’。

贪婪模式和非贪婪模式的匹配处理过程请参考《Python正则表达式W+和W*匹配过程的深入分析》的相关分析。

老猿Python，跟老猿学Python!
博客地址：http://iyenn.com/index/link?url=https://blog.csdn.net/LaoYuanPython
请大家多多支持，点赞、评论和加关注！谢谢！

文章知识点与官方知识档案匹配，可进一步学习相关知识

Python入门技能树首页概览333581 人正在系统学习中

老猿Python

微信公众号

专注Python相关语言、图像音视频处理、AI

评论记录：