登录  /  注册

Python 中正则表达式详解

小云云
发布: 2017-12-18 15:05:40
原创
1798人浏览过


正则表达式是用来简洁表达一组字符串的表达式,本文主要和大家分享python 中正则表达式知识详解,希望能帮助到大家。

操作符 说明 实例
. 表示任何单个字符
[ ] 字符集,单个字符取值范围 [abc]表示a或b或c; [a-z]表示a到z单个字符
[^ ] 非字符集,单个字符排除范围 [^abc]表示非a或非b或非c
* 前一个字符的0次或无限次扩展 abc*表示ab、abc、abcc、abccc...
+ 前一个字符的1次或无限次扩展 abc+表示abc、abcc、abccc...
? 前一个字符的0次或1次扩展 abc?表示ab、abc
| 左右表示任意一个 abc|def 表示abc或def
{m} 前一个字符的m次扩展 ab{2}表示abcc
{m,n} 前一个字符的m至n次扩展(含n) ab{1,2}表示abc、abcc
^ 匹配字符串开头 ^abc表示abc且在一个字符串的开头
$ 匹配字符串结尾 abc$表示abc且在一个字符串的结尾
( ) 分组标记,内部只能使用|操作符 (abc|def)表示abc或def
\d 数字,等价于[0-9]
\w 单词字符,等价于[A-Za-z0-9_]

如果熟悉上面的操作符的话,下面的例子就不难了。

1.只能输入数字:^[0-9]*$

2.只能输入n位的数字:^\d{n}$

3.只能输入至少n位的数字:^\d{n,}$

4.只能输入m~n位的数字:^\d{m,n}$

5.只能输入零和非零开头的数字:^(0|[1-9][0-9]*)$

6.只能输入有两位小数的正实数:^[0-9]+(.[0-9]{2})?$

7.只能输入有1~3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$

8.只能输入非零的正整数:^+?[1-9][0-9]*$


【Python3正则表达式】

函数 说明
re.match() 从字符串的起始位置匹配一个模式,如果起始位置匹配不成功的话,match()就返回none。
re.search() 扫描整个字符串并返回第一个成功的匹配。
re.sub() 用于替换字符串中的所有匹配正则表达式的子串,返回替换后的字符串
re.findall() 搜索字符串,以列表形式返回全部能匹配的子串
re.split() 将字符串按照正则表达式匹配结果进行切割,返回列表
re.finditer() 搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象
>>> match= re.findall(r'[1-9]\d{5}','100081BIT  BIT10008676')>>> print(match)
['100081', '100086']>>> match = re.split(r'[1-9]\d{5}','100081BIT  BIT10008676')>>> match
['', 'BIT  BIT', '76']>>> match = re.split(r'[1-9]\d{5}','100081BIT  BIT10008676',maxsplit=1)>>> match
['', 'BIT  BIT10008676']

>>>for m in re.finditer(r'[1-9]\d{5}','100081BIT  BIT10008676'):       if m:
            print(m.group(0))    
100081100086
登录后复制
登录后复制

re.match与re.search的区别

re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。


这里写图片描述

操作符说明实例
.表示任何单个字符
[ ]字符集,单个字符取值范围[abc]表示a或b或c; [a-z]表示a到z单个字符
[^ ]非字符集,单个字符排除范围[^abc]表示非a或非b或非c
*前一个字符的0次或无限次扩展abc*表示ab、abc、abcc、abccc...
+前一个字符的1次或无限次扩展abc+表示abc、abcc、abccc...
?前一个字符的0次或1次扩展abc?表示ab、abc
|左右表示任意一个abc|def 表示abc或def
{m}前一个字符的m次扩展ab{2}表示abcc
{m,n}前一个字符的m至n次扩展(含n)ab{1,2}表示abc、abcc
^匹配字符串开头^abc表示abc且在一个字符串的开头
$匹配字符串结尾abc$表示abc且在一个字符串的结尾
( )分组标记,内部只能使用|操作符(abc|def)表示abc或def
\d数字,等价于[0-9]
\w单词字符,等价于[A-Za-z0-9_]

如果熟悉上面的操作符的话,下面的例子就不难了。

1.只能输入数字:^[0-9]*$

2.只能输入n位的数字:^\d{n}$

3.只能输入至少n位的数字:^\d{n,}$

4.只能输入m~n位的数字:^\d{m,n}$

5.只能输入零和非零开头的数字:^(0|[1-9][0-9]*)$

6.只能输入有两位小数的正实数:^[0-9]+(.[0-9]{2})?$

7.只能输入有1~3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$

8.只能输入非零的正整数:^+?[1-9][0-9]*$


【Python3正则表达式】

函数说明
re.match()从字符串的起始位置匹配一个模式,如果起始位置匹配不成功的话,match()就返回none。
re.search()扫描整个字符串并返回第一个成功的匹配。
re.sub()用于替换字符串中的所有匹配正则表达式的子串,返回替换后的字符串
re.findall()搜索字符串,以列表形式返回全部能匹配的子串
re.split()将字符串按照正则表达式匹配结果进行切割,返回列表
re.finditer()搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象
>>> match= re.findall(r'[1-9]\d{5}','100081BIT  BIT10008676')>>> print(match)
['100081', '100086']>>> match = re.split(r'[1-9]\d{5}','100081BIT  BIT10008676')>>> match
['', 'BIT  BIT', '76']>>> match = re.split(r'[1-9]\d{5}','100081BIT  BIT10008676',maxsplit=1)>>> match
['', 'BIT  BIT10008676']

>>>for m in re.finditer(r'[1-9]\d{5}','100081BIT  BIT10008676'):       if m:
            print(m.group(0))    
100081100086
登录后复制
登录后复制

re.match与re.search的区别

re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。


这里写图片描述

相关推荐:

关于js正则表达式详解

php正则表达式详解_PHP教程

非常重要的php正则表达式详解,php正则表达式详解

以上就是Python 中正则表达式详解的详细内容,更多请关注php中文网其它相关文章!

智能AI问答
PHP中文网智能助手能迅速回答你的编程问题,提供实时的代码和解决方案,帮助你解决各种难题。不仅如此,它还能提供编程资源和学习指导,帮助你快速提升编程技能。无论你是初学者还是专业人士,AI智能助手都能成为你的可靠助手,助力你在编程领域取得更大的成就。
相关标签:
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
最新问题
关于CSS思维导图的课件在哪? 课件
凡人来自于2024-04-16 10:10:18
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2024 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号