辛星教你高速掌握PHP的正则表达式
辛星教你快速掌握PHP的正则表达式
首先说一下,这篇文章也是我在看了数个大牛的博客之后总结出来的,因此首先向这些大牛表示崇高的敬意和感谢,由于人数众多,而且来源也是特别分散,就不一一介绍了,见谅。
************跨语言的主题**************
1.就如同xml、json、cookie、session、get、post等话题一样,正则表达式是一个跨越了语言的话题,几乎绝大多数语言都支持正则表达式,可以说,只要这门语言支持字符串,它就应该支持正则表达式,因为很多功能不使用正则表达式特别麻烦 ,但是使用了正则表达式就非常简单。
2.正则表达式可以用于邮箱、QQ、手机号等的验证,而且还可以用于采集网页,当然,说白了,正则表达式可以胜任绝大多数对于字符文本的操作,当然,对于解析xml等文件,正则表达式则显得并不是很强力,不过正则表达式对于提取xml中特定的文本信息,依然非常给力。
3.因此,学好正则表达式,不论将来转学哪门语言,都是非常简单的。
*************正则表达式的作用**********
1.正则表达式的主要作用有三个,第一个是正则匹配,第二个是正则替换,第三个是正则提取。
2.所谓正则匹配,是验证一串文本是否符合某个正则表达式规则,比如我们验证用户的是否是一个邮箱,就用到了正则匹配。
3.所谓正则替换,就是我们把文本中的某些信息给替换成另外一些信息,类似于word编辑器中的查找替换功能,快速纠错。
4.所谓正则提取,即使我们从文本中根据我们的正则表达式提取出需要的信息,比如我们从一个html文件中提取出所有的标签,然后根据它的src属性来得到所有的图片的超链接,这就是从一大串文本信息中提取自己会用到的信息 。
5.我们先学习正则表达式的书写,然后在学习如何在PHP中使用正则表达式函数来操作正则表达式。
****************正则表达式的书写规则一***************
1.正则表达式通常用/来作为定界符,即两个斜线之间的部分被当做正则表达式的规则,我们用它去匹配其他的文本,比如/xinxing/这个正则表达式就表示只能比配字符串xinxing。
2.上面我们也看到了,我们的字符是可以出现在正则表达式中的,它们的作用也就是相当于匹配中的一个字符,但是,正则表达式也提供了一些元字符来让我们更加方便的来操作这些字符,这些元字符前面跟一个字符叫做前导字符,一个前导字符和一个元字符一起起作用。
3.我们用+表示其前导字符在目标中连续出现一次或多次,*表示其前导字符在目标中出现零次或者多次,而?则规定其前导对象必须在目标对象中连续出现零次或者一次,其后面的则不管了。
4.比如/xin+/可以匹配到xin,xinnnn,xinn,xinnnnn等,因为这里的+使得n可以出现一次或者多次,而xin?则可以匹配xinxing,xingui,xinguimeng等字符,只要前面有xin就可以了。
5.元字符是一种很粗糙的指定次数的方式,我们可以采用更加精细的操作,比如{m,n}表示至少出现m次,至多出现n次,{m,}表示至少出现m次,{,n}表示至多出现n次,而{t}表示出现固定的t次。
6.比如/xin{3,4}/可以匹配xinnn和xinnnn这两种情况。
**************正则表达式的书写规则二*****************
1.前面我们可以用单个的字符用来做前导字符,显然这是很弱的,我们可以有它的boss版,其中\s用于匹配单个空格符,包括制表符和换行符,\S表示用于匹配单个除了空格之外的所有字符,\d用于匹配从0到9的字符,\w用于匹配字母数字下划线,\W用于所有与\w不匹配的字符,单独的一个点号.表示撇配除了换行之外的所有字符。从上面的数据可以看出,\s和\S的意义正好相反,\w和\W也是这样。
2.比如/\s+/可以用于匹配n个空格,/\d00/可以匹配000、100、200等整百的数字。
***************正则表达式中的定位符和范围表示*********
1.正则表达式中还有所谓的定位符的说法,其中^必须出现在字符串的开头,而$则必须出现在字符串的结尾,而\b则必须出现在目标字符串的开头或者结尾,而\B则必须不能出现在开头或者结尾,只能出现在中间部分。
2.其实可以看出^和$是一对反义词,而\b和\B也是一对反义词。
3.我们可以用一个中括号括起来表示一个字符,而在里面指定范围,比如/[a-z]/表示小写字母从a到z,比如/[0-9]/表示小写字母从0到9的一个数字,比如/[a-c2-6]/表示从a到c或者从2到6的一个字母或者数字相匹配.
4.这种范围修饰符可以和元字符相连的,比如/[a-z][0-9]+/表示以一个字母作为先导,然后跟一个或者多个数字。
5.还有否定符号^用在中括号内表示的是排除,比如[^a-c]表示除去abc之外的任一字母,当^位于中括号内的时候,表示否定,当它位于中括号外的时候,被视作定位符。
6.我们通常用\表示转义符号,没错,在正则表达式中,我们也需要用\表示转义,比如\*就表示匹配*这个符号。
*****************小括号*****************
1.前面说到,元字符只能作用于其前导字符,我们可以用小括号把若干个字符括起来,作为一个整体,此时元字符就可以作用于多个字符了。
2.比如a(bc)*表示一个a后面跟着0个或者多个bc。
3.比如a(bc){0,7}表示a后面跟着0个到7个bc都可以。
4.还有一个|表示OR,即逻辑与,表示两个中选择一个。
5.比如hi|hello表示匹配hi或者hello,比如(a|b)c表示匹配ac或者bc。
**************小练习****************
1.经过我们前面的介绍,我们这里进行一下小小的演练,看看我们究竟掌握了多少。
2.其实ab*和ab{0,}表达的意思是相同的,ab?表示匹配a或者ab。
**********************备注*****************
1.上面我们讲解了正则表达式最主要的部分,还有些细枝末节没有顾忌到,下面我把比较重要的再说一下。
2.前面我们说到了用/来作为定界符,其实还可以用#作为定界符,它是在正则表达式中/出现较多的时候用的,此时正则表达式中的斜线不需要转义。
3.在正则表达式的最后加一个i表示不区分大小写。
4.我们可以分组,也有人称之为群,即Group,调用格式为(?P) 调用方式 (?P=组名)。
**************PHP函数****************
1.我们用preg_match来完成正则匹配的功能,它的第一个参数是正则表达式,第二个参数是要匹配的文本,第三个参数是可选择,表示匹配到的信息,其实它有五个参数,但是我们往往用不了那么多,如下代码示例:
<?php //定义一个正则表达式$reg ="/xi/";//定义一个字符文本$msg ="xinxisgxagxiagslgxigsghg";//这里使用了全部匹配preg_match_all($reg,$msg,$match);//输出匹配到的全部信息print_r($match);
Array ( [0] => Array ( [0] => xi [1] => xi [2] => xi [3] => xi ) )
<?php //定义一个正则表达式$reg ="/xi/";//定义一个字符文本$msg ="xinxisgxagxiagslgxigsghg";//定义替换文本$rep = "oo";//这里使用了全部匹配$str = preg_replace($reg,$rep,$msg);//输出匹配到的全部信息echo $str;
5.正则分割,是把原字符串通过相应的形式进行分割为数组,我们使用preg_split函数,代码示例:
<?php //使用逗号或空格来分隔短语$reg = "/[\s,]+/";//定义原字符串$msg = "hypertext language, programming";$keywords = preg_split($reg,$msg );print_r($keywords);
Array ( [0] => hypertext [1] => language [2] => programming )
********************总结**********************
1.正则表达式是典型的难学易忘的知识,希望可以与诸位读者共勉。
2.我们每到一定的时间就温习一次。

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

PHP 8.4 带来了多项新功能、安全性改进和性能改进,同时弃用和删除了大量功能。 本指南介绍了如何在 Ubuntu、Debian 或其衍生版本上安装 PHP 8.4 或升级到 PHP 8.4

JWT是一种基于JSON的开放标准,用于在各方之间安全地传输信息,主要用于身份验证和信息交换。1.JWT由Header、Payload和Signature三部分组成。2.JWT的工作原理包括生成JWT、验证JWT和解析Payload三个步骤。3.在PHP中使用JWT进行身份验证时,可以生成和验证JWT,并在高级用法中包含用户角色和权限信息。4.常见错误包括签名验证失败、令牌过期和Payload过大,调试技巧包括使用调试工具和日志记录。5.性能优化和最佳实践包括使用合适的签名算法、合理设置有效期、

本教程演示了如何使用PHP有效地处理XML文档。 XML(可扩展的标记语言)是一种用于人类可读性和机器解析的多功能文本标记语言。它通常用于数据存储

静态绑定(static::)在PHP中实现晚期静态绑定(LSB),允许在静态上下文中引用调用类而非定义类。1)解析过程在运行时进行,2)在继承关系中向上查找调用类,3)可能带来性能开销。

字符串是由字符组成的序列,包括字母、数字和符号。本教程将学习如何使用不同的方法在PHP中计算给定字符串中元音的数量。英语中的元音是a、e、i、o、u,它们可以是大写或小写。 什么是元音? 元音是代表特定语音的字母字符。英语中共有五个元音,包括大写和小写: a, e, i, o, u 示例 1 输入:字符串 = "Tutorialspoint" 输出:6 解释 字符串 "Tutorialspoint" 中的元音是 u、o、i、a、o、i。总共有 6 个元

PHP和Python各有优势,选择依据项目需求。1.PHP适合web开发,尤其快速开发和维护网站。2.Python适用于数据科学、机器学习和人工智能,语法简洁,适合初学者。

PHP的魔法方法有哪些?PHP的魔法方法包括:1.\_\_construct,用于初始化对象;2.\_\_destruct,用于清理资源;3.\_\_call,处理不存在的方法调用;4.\_\_get,实现动态属性访问;5.\_\_set,实现动态属性设置。这些方法在特定情况下自动调用,提升代码的灵活性和效率。

PHP是一种广泛应用于服务器端的脚本语言,特别适合web开发。1.PHP可以嵌入HTML,处理HTTP请求和响应,支持多种数据库。2.PHP用于生成动态网页内容,处理表单数据,访问数据库等,具有强大的社区支持和开源资源。3.PHP是解释型语言,执行过程包括词法分析、语法分析、编译和执行。4.PHP可以与MySQL结合用于用户注册系统等高级应用。5.调试PHP时,可使用error_reporting()和var_dump()等函数。6.优化PHP代码可通过缓存机制、优化数据库查询和使用内置函数。7
