登录  /  注册

Python正则表达式:基础篇

高洛峰
发布: 2017-03-03 11:50:17
原创
1186人浏览过

前言

之前有人提了一个需求,我一看此需求用正则表达式最合适不过。考虑到之前每次使用正则表达式,都是临时抱佛脚,于是这次我就一边完成任务一边系统的学习了一遍正则表达式。主要参考PyCon2016上的一个视频Regular Expressions。

我将分几篇文章对正则表达式进行总结。

以下是第一部分,基础: 

基础部分

这里总结了正则表达式最基础的用法,其中大部分内容对我(以及大部分程序员)来说都是平时经常用到的,所以我就一笔带过了,只对其中的几处用例子说明。 

     .           除了换行之外的其他所有字符

     ^           行首

     $           行尾

     [abcd]      abcd其中的一个字符

     [^abcd]     除了abcd之外的任意字符

     [a-d]       相当于[abcd]

     [a-dz]      相当于[abcdz]

     \b          单词边界

     \w          字母数字或下划线 相当于[a-zA-Z0-9_]

     \W          与\w相反

     \d          数字,相当于[0-9]

     \D          与\d相反

     \s          空白字符,相当于[ \t\n\r\f\v]

     \S          与\s相反

     {5}         在此之前的正则表达式部分(下同)准确的出现5次

     {2,5}       ~出现2到5次

     {2,}        ~出现2次或多次

     {,5}        ~出现0到5次

     *          ~出现0次或多次

     ?          ~出现0次或1次

     +           ~出现1次或多次

     ABC|DEF     匹配ABC或者DEF

     \          转义字符,如\表示匹配*,\$表示匹配$* 

\b、 \用以下几个例子简单说明一下: 

     \b:

>>> re.search(r'\bhello\b', 'hello')
<_sre.SRE_Match object; span=(0, 5), match=&#39;hello&#39;>
>>> re.search(r&#39;\bhello\b&#39;, &#39;hello world&#39;)
<_sre.SRE_Match object; span=(0, 5), match=&#39;hello&#39;>
>>> re.search(r&#39;\bhello\b&#39;, &#39;hello,world&#39;)
<_sre.SRE_Match object; span=(0, 5), match=&#39;hello&#39;>
>>> re.search(r&#39;\bhello\b&#39;, &#39;hello_world&#39;) 
>>>
登录后复制

其实这里,\b大体上和\W一支,但是\b可以匹配行首行尾等非显示类的字符,而\W不可以。

\:

>>> re.search(r&#39;\$100&#39;, &#39;$100&#39;)
<_sre.SRE_Match object; span=(0, 4), match=&#39;$100&#39;>
>>> re.search(r&#39;$100&#39;, &#39;$100&#39;) 
>>>
登录后复制

想要匹配那些在正则表达式中有特殊含义的字符,如$、^、*等,就需要用\进行转义。

raw string:

另外,前面例子中,模式字符串(pattern)前面都加了一个r,这个r的意思是raw string,后面所接的字符串,Pyhton解释器无需对其进行转义。因为,\在Python字符串中和正则表达式中都有特殊含义,所以如果不是raw string,那么要表达一个\字符,就需要四个\了(在Python解释器中先转义一次,2个\表示1个\,剩下2个\,在正则表达式中又转义一次,最终剩下一个\)。例如:

>>> re.search(r&#39;\bhello\b&#39;, &#39;hello&#39;)
<_sre.SRE_Match object; span=(0, 5), match=&#39;hello&#39;>
>>> re.search(&#39;\bhello\b&#39;, &#39;hello&#39;) 
>>> re.search(&#39;\\bhello\\b&#39;, &#39;hello&#39;)
<_sre.SRE_Match object; span=(0, 5), match=&#39;hello&#39;>

>>> re.search(&#39;\\\\hello\\\\&#39;, &#39;\\hello\\&#39;) 
<_sre.SRE_Match object; span=(0, 7), match=&#39;\\hello\\&#39;>
>>> re.search(r&#39;\\hello\\&#39;, &#39;\\hello\\&#39;) 
<_sre.SRE_Match object; span=(0, 7), match=&#39;\\hello\\&#39;>
>>> print(&#39;\\hello\\&#39;)
\hello\
登录后复制

更多Python正则表达式:基础篇相关文章请关注PHP中文网!

智能AI问答
PHP中文网智能助手能迅速回答你的编程问题,提供实时的代码和解决方案,帮助你解决各种难题。不仅如此,它还能提供编程资源和学习指导,帮助你快速提升编程技能。无论你是初学者还是专业人士,AI智能助手都能成为你的可靠助手,助力你在编程领域取得更大的成就。
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
关于CSS思维导图的课件在哪? 课件
凡人来自于2024-04-16 10:10:18
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2024 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号