首頁 php教程 php手册 第4章 数据处理-php正则表达式-郑阿奇(续)

第4章 数据处理-php正则表达式-郑阿奇(续)

Jun 13, 2016 pm 12:07 PM
意義 基礎知識 字元 資料處理 通常 正規則 表達式

1.正则表达式基础知识
含义:由普通字符和(a-z)和一些特殊字符组成的字符串模式
功能:有效性验证。
替换文本。
从一个字符串提取一个子字符串。
分类:POSIX和Perl
POSIX风格更容易掌握,但不能用于二进制模式,而perl相对比较复杂。
2.POSIX风格的正则表达式
1.编写正则表达式
表4.3 POSIX正则表达式语法格式列表

字 符

描 述

\

转义字符,用于转义特殊字符。例如,'.'匹配单个字符,'\.'匹配一个点号。'\-'匹配连字符'-','\\'匹配符号'\'

^

匹配输入字符串的开始位置。例如'^he'表示以'he'开头的字符串

$

匹配输入字符串的结束位置。例如,'ok$'表示以'ok'结尾的字符串

*

匹配前面的子表达式零次或多次。例如,'zo*'能匹配"z"以及"zoo"。*等价于{0,}

+

匹配前面的子表达式一次或多次。例如,'zo+'能匹配"zo"以及"zoo",但不能匹配"z"。+等价于{1,}

?

匹配前面的子表达式零次或一次。例如,'do(es)?'可以匹配"do"或"does"中的"do"。'?'等价于{0,1}

{n}

n是一个非负整数。匹配确定的n次。例如,'o{2}'不能匹配"Bob"中的'o',但是能匹配"food" 中的两个'o'

{n,}

n是一个非负整数。至少匹配n次。例如,'o{2,}'不能匹配"Bob"中的'o',但能匹配"foooood" 中的所有'o'。'o{1,}'等价于'o+'。'o{0,}'则等价于'o*'

{n,m}

mn均为非负整数,其中nm。最少匹配n次且最多匹配m次。例如,"o{1,3}"将匹配"fooooood"中的前三个'o'。'o{0,1}'等价于'o?'。请注意在逗号和两个数之间不能有空格

?

当该字符紧跟在任何一个其他限制符(*, +, ?, {n}, {n,}, {n,m})后面时,匹配模式是非贪婪的。非贪婪模式尽可能少地匹配所搜索的字符串,而默认的贪婪模式则尽可能多地匹配所搜索的字符串。例如,对于字符串"oooo",'o+?'将匹配单个"o",而'o+' 将匹配所有'o'

.

匹配除"\n"之外的任何单个字符,要匹配包括'\n' 在内的任何字符,可以使用'[.\n]'的模式

(pattern)

匹配pattern并获取这一匹配。所获取的匹配保存到相应的数组中。要匹配圆括号字符,请使用 '\(' 或 '\)'

(?:pattern)

匹配pattern但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储。这在使用"或"|"来组合一个模式的各个部分时很有用。例如,'industr(?:y|ies).就是一个比'industry|industries'更简略的表达式

(?=pattern)

正向预查,在任何匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如,'Windows(?=95|98|NT|2000)'能匹配"Windows 2000"中的"Windows",但不能匹配"Windows 3.1"中的"Windows"。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始

(?!pattern)

负向预查,在任何不匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如'Windows(?!95|98|NT|2000)'能匹配"'Windows 3.1"中的"Windows",但不能匹配"Windows 2000"中的"Windows"。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始

x|y

匹配x或y。例如,'z|food' 能匹配"z"或"food",'(z|f)ood'则匹配"zood"或"food"

[xyz]

字符集合。匹配所包含的任意一个字符。例如,'[abc]'可以匹配"plain"中的'a'

[^xyz]

负值字符集合。匹配未包含的任意字符。例如,'[^abc]'可以匹配"plain"中的'p'

[a-z]

字符范围。匹配指定范围内的任意字符。例如,'[a-z]'可以匹配'a'到'z' 范围内的任意小写字母字符

[^a-z]

负值字符范围。匹配不在指定范围内的任意字符。例如,'[^a-z]'可以匹配不在'a' 到'z'范围内的任意字符

以下是几个简单的正则表达式的例子:
●'[A-Za-z0-9] ':表示所有的大写字母、小写字母及0到9的数字。
●'^hello':表示以hello开始的字符串。
●'world$':表示以world结尾的字符串。
●'.at':表示以除"\n"外的任意单个字符开头并以"at"结尾的字符串,如"cat"、"nat"等。
●'^[a-zA-Z]':表示一个以字母开头的字符串。
●'hi{2}':表示字母h后跟着两个i即hii。
●'(go)+':表示至少含有一个'go'字符串的字符串,如'gogo'
身份证号码一般由18位数字或17位数字后面加一个X或Y字母组成,要匹配身份证号码,可以写作:
^[0-9]{17}([0-9]|X|Y)$
Email地址的正则表达式可以写作:
^[a-zA-Z0-9\-]+@[a-zA-Z0-9\-]+\.[a-zA-Z0-9\-\.]+$
2.字符串的匹配
ereg()和eregi()函数
使用ereg()函数可以查找字符串与子字符串匹配的情况,并返回匹配字符串的长度,还可以借助参数返回匹配字符的数组。语法格式如下:
int ereg(string ($pattern) , string $string [, array $regs ])

复制代码 代码如下:


/*本例检查字符串是否是ISO格式的日期(YYYY-MM-DD) */
$date="1988-08-09";
$len=ereg ('([0-9]{4})-([0-9]{1,2})-([0-9]{1,2})', $date, $regs);//日期格式为YYYY-MM-DD
if ($len)
{
echo "$regs[3].$regs[2].$regs[1]". "
"; //输出"09.08.1988"
echo $regs[0] ."
"; //输出"1988-08-09"
echo $len; //输出10
}
else
{
echo "错误的日期格式: $date";
}
?>


3.字符串的替换
ereg_replace()函数语法格式如下:
string ereg_replace(string $pattern , string $replacement , string $string)
说明:函数使用字符串$replacement替换字符串$string中与$pattern匹配的部分,并返回替换后的字符串。若未找到匹配项,则原样返回

复制代码 代码如下:


$str="hello world";
echo ereg_replace('[aeo]', 'x',$str). "
"; //输出'hxllx wxrld'
$res='hello';
echo ereg_replace('hello', $res,$str); //使用超链接替换'hello'
?>


4.分割数组

使用split()函数可以完成与explode()函数一样的功能,而且可以根据给出的正则表达式来分割字符串,并返回一个数组。语法格式如下:

array split(string $pattern , string $string [, int $limit ])

5.产生正则表达式

3.Perl兼容的正则表达式

1.编写正则表达式

表4.4 Perl兼容正则表达式扩充的语法格式

字 符

描 述

\b

匹配一个单词边界,也就是指单词和空格间的位置。例如,'er\b'可以匹配"never"中的 'er',但不能匹配"verb"中的'er'

\B

匹配非单词边界。'er\B'能匹配"verb"中的'er',但不能匹配"never"中的'er'

\cx

匹配由x指明的控制字符。例如,'\cM'匹配一个Control-M或回车符。x的值必须为A~Z或a~z之一。否则,将'c'视为一个原义的'c'字符

\d

匹配一个数字字符。等价于'[0-9]'

\D

匹配一个非数字字符。等价于'[^0-9]'

\f

匹配一个换页符。等价于'\x0c'和'\cL'

\n

匹配一个换行符。等价于'\x0a'和'\cJ'

\r

匹配一个回车符。等价于'\x0d'和'\cM'

\s

匹配任何空白字符,包括空格、制表符、换页符等。等价于' [ \f\n\r\t\v] '

\S

匹配任何非空白字符。等价于' [^ \f\n\r\t\v] '

\t

匹配一个制表符。等价于'\x09'和'\cI'

\v

匹配一个垂直制表符。等价于'\x0b'和'\cK'

\w

匹配包括下划线的任何单词字符。等价于'[A-Za-z0-9_]'

\W

匹配任何非单词字符,等价于'[^A-Za-z0-9_]'

\xn

匹配n,其中n为十六进制转义值。十六进制转义值必须为确定的两个数字长。例如,'\x41' 匹配"A"。'\x041'则等价于'\x04' & "1"。正则表达式中可以使用ASCII编码

\num

匹配num,其中num是一个正整数。对所获取的匹配的引用。例如,'(.)\1'匹配两个连续的相同字符

\n

标志一个八进制转义值或一个后向引用。如果\n之前至少有n个获取得子表达式,则n为后向引用。否则,如果n为八进制数字(0~7),则n为一个八进制转义值

\nm

标志一个八进制转义值或一个后向引用。如果\nm之前至少有nm个获取得子表达式,则 nm为后向引用。如果\nm之前至少有n个获取,则n为一个后跟文字m的后向引用。如果前面的条件都不满足,若 n和m均为八进制数字(0~7),则\nm将匹配八进制转义值nm

\nml

如果n为八进制数字(0~3),且m和l均为八进制数字(0~7),则匹配八进制转义值nml

\un

匹配n,其中n是用4个十六进制数字表示的Unicode字符。例如,'\u00A9'匹配版权符号(©)

2.字符串匹配
preg_match()函数进行字符串的查找,语法格式如下:
int preg_match(string $pattern , string $subject [, array $matches [, int $flags ]])
说明:该函数的结构与ereg()函数类似,在$subject字符串中搜索与$pattern给出的正则表达式相匹配的内容。
preg_match()函数返回$pattern所匹配的次数。不是0次(没有匹配)就是1次,因为preg_match()函数在第一次匹配之后将停止搜索
还有一个是preg_match_all(),从第一个匹配的末尾开始继续搜索,直到搜索完整个字符串。
preg_match_all()函数参数$flags的值可以取以下三种:
●PREG_PATTERN_ORDER。默认项,表示$matches[0]为全部模式匹配的数组,
$matches[1]为第一个括号中的子模式所匹配的字符串组成的数组,以此类推。
●PREG_SET_ORDER。如果设定此标记,则$matches[0]为第一组匹配项的数组,$matches[1]为第二组匹配项的数组,以此类推。
●PREG_OFFSET_CAPTURE。PREG_OFFSET_CAPTURE可以和其他两个标记组合使用,
如果设定本标记,对每个出现的匹配结果也同时返回其附属的字符串偏移量。
3.字符串的替换
使用preg_replace()函数能够完成与函数ereg_replace()相同的功能,在字符串中查找匹配的子字符串,并用指定字符串替换子字符串。
语法格式如下:
mixed preg_replace(mixed $pattern , mixed $replacement , mixed $subject [, int $limit ])
4.字符串的分割
preg_split()函数可以使用正则表达式作为边界分割一个字符串,并将子字符串存入一个数组返回,作用与split()函数类似。
语法格式如下:
array preg_split(string $pattern , string $subject [, int $limit [, int $flags ]])
说明:本函数区分大小写,返回一个数组,数组包含$subject中沿着与$pattern匹配的边界所分割的子串。
$limit是可选参数,如果指定则最多返回$limit个字串,如果省略或为-1,则没有限制。
$flags的值可以是以下三种:
●PREG_SPLIT_NO_EMPTY。如果设定本标记,则函数只返回非空的字符串。
●PREG_SPLIT_DELIM_CAPTURE。如果设定本标记,定界符模式中的括号表达式的匹配项也会被捕获并返回。
PREG_SPLIT_OFFSET_CAPTURE。如果设定本标记,对每个出现的匹配结果也同时返回其附属的字符串偏移量。
4.3实例-验证表单内容
【例4.4】 使用正则表达式验证用户输入的表单内容是否满足格式要求。
新建EX4_4_Hpage.php文件,输入以下代码。

复制代码 代码如下:


include 'EX4_4_Hpage.php'; //包含文件EX4_4Hpage.php
$id=$_POST['ID'];
$pwd=$_POST['PWD'];
$phone=$_POST['PHONE'];
$Email=$_POST['EMAIL'];
$checkid=preg_match('/^\w{1,10}$/',$id); //检查字符串是否在10个字符以内
$checkpwd=preg_match('/^\d{4,14}$/',$pwd); //检查是否在4~14个数字之间
$checkphone=preg_match('/^1\d{10}$/',$phone); //检查是否是以1开头的11位数字
//检查Email地址的合法性
$checkEmail=preg_match('/^[a-zA-Z0-9_\-]+@[a-zA-Z0-9\-]+\.[a-zA-Z0-9\-\.]+$/',$Email);
if($checkid&&$checkpwd&&$checkphone&&$checkEmail) //如果都为1,则注册成功
echo "注册成功!";
else
echo "注册失败,格式不对";
?>


新建EX4_4_Ppage.php文件,输入以下代码:
2.字符串匹配
preg_match()函数进行字符串的查找,语法格式如下:
int preg_match(string $pattern , string $subject [, array $matches [, int $flags ]])
说明:该函数的结构与ereg()函数类似,在$subject字符串中搜索与$pattern给出的正则表达式相匹配的内容。
preg_match()函数返回$pattern所匹配的次数。不是0次(没有匹配)就是1次,因为preg_match()函数在第一次匹配之后将停止搜索
还有一个是preg_match_all(),从第一个匹配的末尾开始继续搜索,直到搜索完整个字符串。
preg_match_all()函数参数$flags的值可以取以下三种:
●PREG_PATTERN_ORDER。默认项,表示$matches[0]为全部模式匹配的数组,
$matches[1]为第一个括号中的子模式所匹配的字符串组成的数组,以此类推。
●PREG_SET_ORDER。如果设定此标记,则$matches[0]为第一组匹配项的数组,$matches[1]为第二组匹配项的数组,以此类推。
●PREG_OFFSET_CAPTURE。PREG_OFFSET_CAPTURE可以和其他两个标记组合使用,
如果设定本标记,对每个出现的匹配结果也同时返回其附属的字符串偏移量。
3.字符串的替换
使用preg_replace()函数能够完成与函数ereg_replace()相同的功能,在字符串中查找匹配的子字符串,并用指定字符串替换子字符串。
语法格式如下:
mixed preg_replace(mixed $pattern , mixed $replacement , mixed $subject [, int $limit ])
4.字符串的分割
preg_split()函数可以使用正则表达式作为边界分割一个字符串,并将子字符串存入一个数组返回,作用与split()函数类似。
语法格式如下:
array preg_split(string $pattern , string $subject [, int $limit [, int $flags ]])
说明:本函数区分大小写,返回一个数组,数组包含$subject中沿着与$pattern匹配的边界所分割的子串。
$limit是可选参数,如果指定则最多返回$limit个字串,如果省略或为-1,则没有限制。
$flags的值可以是以下三种:
●PREG_SPLIT_NO_EMPTY。如果设定本标记,则函数只返回非空的字符串。
●PREG_SPLIT_DELIM_CAPTURE。如果设定本标记,定界符模式中的括号表达式的匹配项也会被捕获并返回。
PREG_SPLIT_OFFSET_CAPTURE。如果设定本标记,对每个出现的匹配结果也同时返回其附属的字符串偏移量。
4.3实例-验证表单内容
【例4.4】 使用正则表达式验证用户输入的表单内容是否满足格式要求。
新建EX4_4_Hpage.php文件,输入以下代码。

复制代码 代码如下:


include 'EX4_4_Hpage.php'; //包含文件EX4_4Hpage.php
$id=$_POST['ID'];
$pwd=$_POST['PWD'];
$phone=$_POST['PHONE'];
$Email=$_POST['EMAIL'];
$checkid=preg_match('/^\w{1,10}$/',$id); //检查字符串是否在10个字符以内
$checkpwd=preg_match('/^\d{4,14}$/',$pwd); //检查是否在4~14个数字之间
$checkphone=preg_match('/^1\d{10}$/',$phone); //检查是否是以1开头的11位数字
//检查Email地址的合法性
$checkEmail=preg_match('/^[a-zA-Z0-9_\-]+@[a-zA-Z0-9\-]+\.[a-zA-Z0-9\-\.]+$/',$Email);
if($checkid&&$checkpwd&&$checkphone&&$checkEmail) //如果都为1,则注册成功
echo "注册成功!";
else
echo "注册失败,格式不对";
?>


新建EX4_4_Ppage.php文件,输入以下代码:

复制代码 代码如下:


include 'EX4_4_Hpage.php'; //包含文件EX4_4Hpage.php
$id=$_POST['ID'];
$pwd=$_POST['PWD'];
$phone=$_POST['PHONE'];
$Email=$_POST['EMAIL'];
$checkid=preg_match('/^\w{1,10}$/',$id); //检查字符串是否在10个字符以内
$checkpwd=preg_match('/^\d{4,14}$/',$pwd); //检查是否在4-14个字符之间
$checkphone=preg_match('/^1\d{10}$/',$phone); //检查是否是以1开头的11位数子
//检查Email地址的合法性
$checkEmail=preg_match('/^[a-zA-Z0-9_\-]+@[a-zA-Z0-9\-]+\.[a-zA-Z0-9\-\.]+$/',$Email);
if($checkid&&$checkpwd&&$checkphone&&$checkEmail) //如果都为1,则注册成功
echo "注册成功!";
else
echo "注册失败,格式不对";
?>

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆樹的耳語 - 如何解鎖抓鉤
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1665
14
CakePHP 教程
1423
52
Laravel 教程
1321
25
PHP教程
1269
29
C# 教程
1249
24
了解PHP中eol的意思 了解PHP中eol的意思 Mar 20, 2024 am 11:09 AM

深入了解PHP中eol的含義及程式碼範例在PHP程式設計中,eol是一個常見的術語,代表&quot;EndOfLine&quot;,即行尾。在不同作業系統中,行尾的表示方式可能不同,這就引出了eol的概念。在Windows系統中,一行的結束由回車符()和換行符()組成,即&quot;&quot;;而在Unix/Linux系統中,行尾只由換行符()表示,即&quot;&quot;。這樣的差異可能會導致在不同作業系統

怎麼關閉快手私訊顯示內容功能?關閉快手私訊顯示內容什麼意思? 怎麼關閉快手私訊顯示內容功能?關閉快手私訊顯示內容什麼意思? Mar 21, 2024 pm 05:41 PM

作為國內領先的短視頻平台,快手擁有大量用戶,私訊功能是用戶之間互動的重要管道。然而,有些用戶可能覺得私訊顯示內容的功能讓他們感到困擾,他們希望能夠選擇性地關閉這個功能。一、怎麼關閉快手私訊顯示內容功能? 1.開啟快手應用,登入個人帳號。 2.進入快手主介面,點選右下角的「我的」按鈕,進入個人中心。 3.在個人中心頁面,點選頭像,進入個人設定。 4.在個人設定頁面,找到「隱私設定」選項,點選進入。 5.在隱私權設定頁面,找到「私訊顯示內容」選項,點選進入。 6.在私訊顯示內容設定頁面,關閉「私訊顯示內容」功能的

Golang如何提升資料處理效率? Golang如何提升資料處理效率? May 08, 2024 pm 06:03 PM

Golang透過並發性、高效能記憶體管理、原生資料結構和豐富的第三方函式庫,提升資料處理效率。具體優勢包括:並行處理:協程支援同時執行多個任務。高效率記憶體管理:垃圾回收機制自動管理記憶體。高效資料結構:切片、映射和通道等資料結構快速存取和處理資料。第三方函式庫:涵蓋fasthttp和x/text等各種資料處理庫。

如何用 Golang 正規匹配多個單字或字串? 如何用 Golang 正規匹配多個單字或字串? May 31, 2024 am 10:32 AM

Golang正規表示式使用管道符|來匹配多個單字或字串,將各個選項作為邏輯OR表達式分隔開來。例如:匹配"fox"或"dog":fox|dog匹配"quick"、"brown"或"lazy":(quick|brown|lazy)匹配"Go"、"Python"或"Java":Go|Python |Java匹配字或4位郵遞區號:([a-zA

WICC幣是什麼? WICC幣是什麼? Feb 21, 2024 pm 06:00 PM

WICC幣是什麼? WICC幣是WaykiChainCoin的簡稱,是基於區塊鏈技術的數位貨幣。 WaykiChain作為一條高效、可擴展和安全的公鏈,致力於為企業和開發者提供完善的區塊鏈基礎設施和創新工具。作為WaykiChain生態系統的核心代幣,WICC幣在平台上扮演著重要角色。 WICC幣的特性1.安全可靠:WaykiChain採用DPoS共識演算法,具備可靠的分散式鎖定機制與共識機制,確保了網路的高度安全性。 2.高效可擴展:WaykiChain具備毫秒級的交易確認速度,每秒可處理數千筆交易,並

詳解 MySQL 主機名稱的涵義 詳解 MySQL 主機名稱的涵義 Mar 01, 2024 pm 12:03 PM

MySQL主機名的意義及具體用法MySQL是一種流行的開源關係型資料庫管理系統,被廣泛應用於各種web應用程式中。在MySQL中,主機名稱是一個重要的概念,它用來指定連接到資料庫伺服器的主機的名稱。在本文中,我們將詳細解釋MySQL主機名稱的含義,以及如何在實際開發中使用它。 MySQL主機名稱的意思:在MySQL中,主機名稱是用來指定允許連線到

使用Redis提升Laravel應用的資料處理效率 使用Redis提升Laravel應用的資料處理效率 Mar 06, 2024 pm 03:45 PM

使用Redis提升Laravel應用的資料處理效率隨著網路應用的不斷發展,資料處理效率成為了開發者關注的重點之一。在開發基於Laravel框架的應用時,我們可以藉助Redis來提升資料處理效率,實現資料的快速存取和快取。本文將介紹如何使用Redis在Laravel應用中進行資料處理,並提供具體的程式碼範例。一、Redis簡介Redis是一種高效能的記憶體數據

Laravel 和 CodeIgniter 中資料處理能力的比較如何? Laravel 和 CodeIgniter 中資料處理能力的比較如何? Jun 01, 2024 pm 01:34 PM

比較Laravel和CodeIgniter的資料處理能力:ORM:Laravel使用EloquentORM,提供類別物件關係映射,而CodeIgniter使用ActiveRecord,將資料庫模型表示為PHP類別的子類別。查詢建構器:Laravel具有靈活的鍊式查詢API,而CodeIgniter的查詢建構器更簡單,基於陣列。資料驗證:Laravel提供了一個Validator類,支援自訂驗證規則,而CodeIgniter的驗證功能內建較少,需要手動編碼自訂規則。實戰案例:用戶註冊範例展示了Lar

See all articles