|
写在前面:PHP正则的执行效率并不高,而且比较耗资源,能不能则不用。
我在写小偷中用了大量的正则,所以在接下来的版本中要逐步减少正则的应用
在PHP正则表达式中需要转义的字符如下:
$^*()+={}[]|/:<>.?'"
注意:perl风格中表达式要求以/开始和结尾,如:/food/ 表匹配字符 food
perl修饰符如下:
i 完成不区分大小写的搜索 g 查找所有出现(all occurrences,完成全局搜索) m 将一个字符串视为多行(m就表示多(multiple))。默认情况下,^和$字符匹配字符串中的最开始和最末尾。使用m修饰符将使^和$匹配字符串中每行的开始 s 将一个字符串视为一行,忽略其中的所有换行符;它与m修饰符正好相反 x 忽略正则表达式中的空白和注释 U 第一次匹配后停止。默认情况下,将找到最后一个匹配字符结果。利用这个修饰符可以在第一次匹配后停止。进而形式循环匹配。
元字符说明:
利用Perl正则表达式还可以做另一件有用的事情,这就是使用各种元字符来搜索匹配。元字符(metacharacter)就是一个前面有反斜线的字母字符,表示某种特殊含义。以下是一些有用的元字符。
A 只匹配字符串开头 b 匹配单词边界 B 匹配单词边界之外的任意字符 d 匹配数字字符,它与[0-9]相同 D 匹配非数字字符 s 匹配空白字符 S 匹配非空白字符 [] 包围一个字符类,字符类包括:[0-9] [a-z] [a-zA-Z] 等类似。 () 包围一个字符分组或定义一个反引用 $ 匹配行尾 ^ 匹配行首 * 匹配前面的子表达式零次或多次。要匹配 * 字符,请使用 * + 匹配前面的子表达式一次或多次。要匹配 + 字符,请使用 + ? 匹配前面的子表达式零次或一次,或指明一个非贪婪限定符 ? . 匹配除换行之外的任何字符 引出下一个元字符 w 匹配任何只包含下划线和字母数字字符的字符串,它与 [a-zA-Z0-9_]相同 W 匹配没有下划线和字母数字字符的字符串
Perl风格函数有:
array preg_grep(string pattern, array input [, flags]) 搜索数组中所有元素,返回由与某个模式匹配的所有元素组成的数组 PHP 4.3增加了一个可选参数 flag,它接受一个值 PREG_GREP_INVERT 传递此标志将得到与该模式不匹配的数据元素。
int preg_match(string pattern, string string [, array matches [, int flags [, int offset]]]) 在字符串中搜索模式,如果存在返回TRUE,否则返回FALSE。 可选输入参数matches可以包含搜索模式中包含的子模式的各个部分。默认返回 匹配的字符串,当有()子包围时,会在数组后面输出。
int preg_match_all(string pattern, string string, array pattern_array [, int order]) 和函数 preg_match一样,不过 preg_match 只搜索一次,而 preg_match_all 会执行循环搜索,返回所有匹配的结果。
mixed preg_replace(mixed pattern, mixed replacement, mixed str [, int limit]) 用replacement替换pattern的所有出现,并返回修改后的结果。 可选 limit 指定应当发生多少次匹配。不设置limit或设置为-1将替换所有出现的情况。
以上为常用函数,还有 preg_quote, preg_replace_callbak, preg_split等详细解释略。。。 |
|