首页 > Python教程 > 正文

python正则表达式中re模块的使用方法有哪些?re模块用法介绍

原创 2018-09-15 14:15:44 0 80
赞助会员专享特权
本篇文章给大家带来的内容是关于python正则表达式中re模块的使用方法有哪些?re模块用法介绍,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。

正则是处理字符串最常用的方法,我们编码中到处可见正则的身影。

正则大同小异,python 中的正则跟其他语言相比略有差异:

1、替换字符串时,替换的字符串可以是一个函数

2、split 函数可以指定分割次数,这会导致有个坑

3、前项界定的表达式必须定长

下面详细描述下re模块的使用方法,其实,注意上面提到的三点差异就好

1、match

说明:

re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回 None。

语法:

re.match(pattern, string, flags=0)

flags为可选标识,多个标识可以通过按位或 (|) 来指定。如 re.I | re.M 被设置成 I 和 M 标识:

修饰符

描述

re.I

使匹配对大小写不敏感

re.L

做本地化识别(locale-aware)匹配

re.M

多行匹配,影响 ^ 和 $

re.S

使 . 匹配包括换行在内的所有字符

re.U

根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.

re.X

该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。

匹配成功re.match方法返回一个匹配的对象,可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。group() 或 group(0),返回整个正则表达式的匹配结果。

举例:

s= 'abc123abc'
print(re.match('[a-z]+', s))           # <_sre.SRE_Match object; span=(0, 3), match='abc'>
print(re.match('[a-z]+', s).group(0))      # abc
print(re.match('[\d]+', s))            # None
print(re.match('[A-Z]+', s, re.I).group(0))   # abc
print(re.match('[a-z]+', s).span())       # (0, 3)

2、search

说明:

re.search 扫描整个字符串并返回第一个成功的匹配。

语法:

re.search(pattern, string, flags=0)

匹配成功re.search方法返回一个匹配的对象,否则返回None。可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。

举例:

s = 'abc123abc'
print(re.search('[a-z]+', s).group())  # abc
print(re.search('[a-z]+', s).span())   # (0, 3)
print(re.search('[\d]+', s).group())   # 123
print(re.search('[\d]+', s).span())    # (3, 6)
print(re.search('xyz', s))         # None

groupdict

groupdict 返回匹配到的所有命名子组的字典。

print(re.search('[a-z]+', s).groupdict())          # {}
print(re.search('(?P<letter>[a-z]+)(?P<num>\d+)', s).groupdict())  # {'num': '123', 'letter': 'abc'}

3、sub 和 subn

说明:

re.sub用于替换字符串中的匹配项。

re.subn返回一个元组,包含替换后的字符串及替换次数。

语法:

sub(pattern, repl, string, count=0, flags=0)

repl: 替换的字符串,也可为一个函数。

count: 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。

举例:

s = 'abc123abc'
print(re.sub('[\d]+', '数字', s))       # abc数字abc
print(re.sub('[a-z]+', '字母', s, 1))   # 字母123abc
# 将匹配的数字乘以 2
def double(matched):
    value = int(matched.group('value'))
    return str(value * 2)
# repl是一个函数
print(re.sub('(?P<value>\d+)', double, s))  # abc246abc
print(re.subn('[\d]+', '数字', s))        # ('abc数字abc', 1)
print(re.subn('[a-z]+', '字母', s,))      # ('字母123字母', 2)
print(re.subn('[a-z]+', '字母', s, 1))     # ('字母123字母', 1)

4、compile

说明:

re.compile 用于编译正则表达式,生成一个正则表达式(Pattern)对象,供 match() 和 search() 这两个函数使用。

语法:

compile(pattern, flags=0)

举例:

s = 'abc123abc'
p = re.compile('[\d]+')
print(p.match(s, 4, 5).group(0))    # 2 从位置4开始匹配到位置5
print(p.search(s).group(0))         # 123

5、findall

说明:

re.findall 在字符串中查找正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。

语法:

findall(pattern, string, flags=0)

举例:

s = 'abc123abc'
print(re.findall('[a-z]+', s))  # ['abc', 'abc']
print(re.findall('[h-n]+', s))  # []

6、finditer

说明:

finditer和 findall 类似,在字符串中查找正则表达式所匹配的所有子串,并把它们作为一个迭代器返回。

语法:

finditer(pattern, string, flags=0)

举例:

s = 'abc123def'
it = re.finditer('[a-z]+', s)
for match in it:    print(match.group())

7、split

说明:

re.split 方法按照能够匹配的子串将字符串分割后返回列表。

语法:

split(pattern, string, maxsplit=0, flags=0)

maxsplit:分隔次数,maxsplit=1 分隔一次,默认为 0,不限制次数。

举例:

print(re.split('a', '1A1a2A3', re.I))           # ['1A1', '2A3']# 输出结果并未能区分大小写,这是因为re.split(pattern,string,maxsplit, flags)默认是四个参数,当我们传入的三个参数的时候,系统会默认re.I是第三个参数,所以就没起作用。# 如果想让这里的re.I起作用,写成flags=re.I即可。
print(re.split('a', '1A1a2A3', flags=re.I))     # ['1', '1', '2', '3']

8、escape

说明:

re.escape对字符串里面的特殊字符串进行转义。

语法:

escape(pattern)

举例:

print(re.escape('www.dxy.cn'))  # www\.dxy\.cn

9、正则

“(?P<name>…)”:分组,并将其命名为<name>。

“(?P=name)”:引用别名为<name>的分组匹配到的串。

10、前项(否定)界定中的特殊

正则中常用的前项界定(?<=exp)和前项否定界定(?<!exp)在 python 中会报错:look-behind requires fixed-width pattern,原因是 python 中前项界定的表达式必须是定长的,例如

(?<=aaa)   # 正确
(?<=aaa|bbb) # 正确
(?<=aaa|bb) # 错误
(?<=\d+)   # 错误
(?<=\d{3})  # 正确

相关推荐:

python中logging模块有什么用?logging模块的用法介绍

python模块之re正则表达式详细介绍

以上就是python正则表达式中re模块的使用方法有哪些?re模块用法介绍的详细内容,更多请关注php中文网其它相关文章!

  • 相关标签:re模块
  • 本文原创发布php中文网 ,转载请注明出处,感谢您的尊重!
  • 相关文章


  • PYTHON正则表达式 re模块使用说明
  • python正则表达式re模块详解
  • Python基础教程之正则表达式基本语法以及re模块
  • Python re模块介绍
  • Python学习之asyncore模块用法实例教程
  • python正则表达式中re模块的使用方法有哪些?re模块用法介绍
  • 网友评论

    文明上网理性发言,请遵守 新闻评论服务协议

    我要评论
    独孤九贱(4)_PHP视频教程

    独孤九贱(4)_PHP视频教程

    江湖传言:PHP是世界上最好的编程语言。真的是这样吗?这个梗究竟是从哪来的?学会本课程,你就会明白了。 PHP中文网出品的PHP入门系统教学视频,完全从初学者的角度出发,绝不玩虚的,一切以实用、有用...

    独孤九贱(5)_ThinkPHP5视频教程

    独孤九贱(5)_ThinkPHP5视频教程

    ThinkPHP是国内最流行的中文PHP开发框架,也是您Web项目的最佳选择。《php.cn独孤九贱(5)-ThinkPHP5视频教程》课程以ThinkPHP5最新版本为例,从最基本的框架常识开始,将...

    独孤九贱(1)_HTML5视频教程

    独孤九贱(1)_HTML5视频教程

    《php.cn原创html5视频教程》课程特色:php中文网原创幽默段子系列课程,以恶搞,段子为主题风格的php视频教程!轻松的教学风格,简短的教学模式,让同学们在不知不觉中,学会了HTML知识。 ...

    ThinkPHP5实战之[教学管理系统]

    ThinkPHP5实战之[教学管理系统]

    本套教程,以一个真实的学校教学管理系统为案例,手把手教会您如何在一张白纸上,从零开始,一步一步的用ThinkPHP5框架快速开发出一个商业项目。

    PHP入门视频教程之一周学会PHP

    PHP入门视频教程之一周学会PHP

    所有计算机语言的学习都要从基础开始,《PHP入门视频教程之一周学会PHP》不仅是PHP的基础部分更主要的是PHP语言的核心技术,是学习PHP必须掌握的内容,任何PHP项目的实现都离不开这部分的内容,通...

    相关视频教程

  • Python在数据科学中的应用 Python在数据科学中的应用
  • Python 面向对象视频教程 Python 面向对象视频教程
  • python遇见数据采集视频教程 python遇见数据采集视频教程
  • Python Web入门视频教程 Python Web入门视频教程
  • Python Web框架Flask进阶视频教程 Python Web框架Flask进阶视频教程
  • Python进阶视频教程 Python进阶视频教程
  • 相关视频章节