首页 最新 热门 推荐

  • 首页
  • 最新
  • 热门
  • 推荐

第11.18节 Python 中re模块的匹配对象

  • 23-09-22 18:30
  • 3602
  • 7234
blog.csdn.net

匹配对象是Python中re模块正则表达式匹配处理的返回结果,用于存放匹配的情况。老猿认为匹配对象更多的应该是与组匹配模式的功能对应的,只是没有使用组匹配模式的正则表达式整体作为组0。
为了说明下面的属性和方法,以如下命名组匹配模式串和搜索文本作为例子来介绍:

>>> pattern='

(?P.*)

(?P[0-9]{1,3})

' >>> str='

LaoYuanPython

28

' >>> m=re.search(pattern,str)
  • 1
  • 2
  • 3
  • 4

匹配对象有如下重要属性:

  1. re:该匹配对象对应的正则表达式。如:
>>> m.re
re.compile('

(?P.*)

(?P[0-9]{1,3})

')
  • 1
  • 2
  1. string:该匹配对象对应的搜索字符串。如:
>>> m.string
'

LaoYuanPython

28

'
  • 1
  • 2
  1. lastgroup:最后一个匹配组的名字,如果没有匹配到或没有给组命名则为None。如:
>>> m.lastgroup
'age'
  • 1
  • 2
  1. lastindex:最后一个匹配组的序号,关于组的序号请参考《第11.16节 Python正则元字符“()”(小括号)与组(group)匹配模式》的介绍。如:
>>> m.lastindex
2
  • 1
  • 2

匹配对象有如下重要方法:

  1. expand(template):对template的模板字符串的反斜杠进行转义并且返回,数字引用(1, 2)和命名组(g<1>, g) 替换为相应组的内容。
>>> m=re.search('(Lao)(w+)(Python)','LaoYuanPython')
>>> m

>>> m.expand(r'1g<0>2

')
'LaoLaoYuanPythonYuan

'
>>>
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

注意组0不能使用来访问,必须使用g<0>进行访问。
2. start([group])、end([group]):表示匹配到的组对应字符串在搜索串中的起始位置和结束位置,其中group可以是组号或组名,可以不传,则默认为组0。如:

>>> m.start(1),m.end(1)
(17, 30)
  • 1
  • 2
  1. group([group1, …]):显示对应组匹配的搜索到的结果子串,参数可以为空,则显示组0的匹配结果串即整个搜索串,也可以为多个组,组可以是组号或组名来表示。如:
>>> m.group(0,1,2)
('

LaoYuanPython

28

', 'LaoYuanPython', '28') >>> m.group(0,1,'age') ('

LaoYuanPython

28

', 'LaoYuanPython', '28')
  • 1
  • 2
  • 3
  • 4
  1. groups(default=None):返回一个元组,包含所有参与匹配的子组(不含组0)。 default 参数用于未参与匹配的子组显示,默认为 None.
>>> m.groups()
('LaoYuanPython', '28')
关于未匹配子组的情况,Python官网的如下例子可以说明:
>>> m = re.match(r"(d+).?(d+)?", "24")
>>> m.groups()      # Second group defaults to None.
('24', None)
>>> m.groups('0')   # Now, the second group defaults to '0'.
('24', '0')
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  1. groupdict(default=None):返回一个字典,包含了所有的 命名 子组(关于命名子组请参考《》的介绍)。key就是组名。 default 参数用于不参与匹配的组合;默认为 None。 例如:
>>> m.groupdict()
{'name': 'LaoYuanPython', 'age': '28'}
  • 1
  • 2
  1. span([group]):返回匹配对象对应组匹配到文本在搜索文本中的起始和终止位置的元组,其结果与(m.start(group), m.end(group))相同 。 注意如果 参数group 没有在这个匹配中,就返回 (-1, -1) 。group 默认为0,就是整个匹配。
>>> m.span(1)
(17, 30)

  • 1
  • 2
  • 3

案例:

>>> pattern='

(?P.*)

(?P[0-9]{1,3})

' >>> str='

LaoYuanPython

28

' >>> m=re.search(pattern,str) >>> m.start('name'),m.end('name') (17, 30) >>> m.start(1),m.end(1) (17, 30) >>> m.string '

LaoYuanPython

28

' >>> m.re re.compile('

(?P.*)

(?P[0-9]{1,3})

') >>> m.lastgroup 'age' >>> m.lastindex 2
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

老猿Python,跟老猿学Python!
博客地址:http://iyenn.com/index/link?url=https://blog.csdn.net/LaoYuanPython

请大家多多支持,点赞、评论和加关注!谢谢!

文章知识点与官方知识档案匹配,可进一步学习相关知识
Python入门技能树网络爬虫正则表达式333596 人正在系统学习中
老猿Python
微信公众号
专注Python相关语言、图像音视频处理、AI
注:本文转载自blog.csdn.net的LaoYuanPython的文章"https://blog.csdn.net/LaoYuanPython/article/details/99999114"。版权归原作者所有,此博客不拥有其著作权,亦不承担相应法律责任。如有侵权,请联系我们删除。
复制链接
复制链接
相关推荐
发表评论
登录后才能发表评论和回复 注册

/ 登录

评论记录:

未查询到任何数据!
回复评论:

分类栏目

后端 (14832) 前端 (14280) 移动开发 (3760) 编程语言 (3851) Java (3904) Python (3298) 人工智能 (10119) AIGC (2810) 大数据 (3499) 数据库 (3945) 数据结构与算法 (3757) 音视频 (2669) 云原生 (3145) 云平台 (2965) 前沿技术 (2993) 开源 (2160) 小程序 (2860) 运维 (2533) 服务器 (2698) 操作系统 (2325) 硬件开发 (2492) 嵌入式 (2955) 微软技术 (2769) 软件工程 (2056) 测试 (2865) 网络空间安全 (2948) 网络与通信 (2797) 用户体验设计 (2592) 学习和成长 (2593) 搜索 (2744) 开发工具 (7108) 游戏 (2829) HarmonyOS (2935) 区块链 (2782) 数学 (3112) 3C硬件 (2759) 资讯 (2909) Android (4709) iOS (1850) 代码人生 (3043) 阅读 (2841)

热门文章

101
推荐
关于我们 隐私政策 免责声明 联系我们
Copyright © 2020-2024 蚁人论坛 (iYenn.com) All Rights Reserved.
Scroll to Top