新聞中心
PHP函數(shù)preg_match_all的具體使用方法我們可以在PHP語言學(xué)習(xí)中初步掌握,那么在實際使用中我們是否能正確的對這個函數(shù)進行運用呢?今天我們就為大家介紹PHP函數(shù)preg_match_all在正則表達式測試中的運用。

成都創(chuàng)新互聯(lián)是一家專注于成都網(wǎng)站設(shè)計、成都網(wǎng)站建設(shè)與策劃設(shè)計,黃州網(wǎng)站建設(shè)哪家好?成都創(chuàng)新互聯(lián)做網(wǎng)站,專注于網(wǎng)站建設(shè)十載,網(wǎng)設(shè)計領(lǐng)域的專業(yè)建站公司;建站業(yè)務(wù)涵蓋:黃州等地區(qū)。黃州做網(wǎng)站價格咨詢:028-86922220
PHP函數(shù)preg_match_all代碼實例:
- $html = '< div id="biuuu">
- php自學(xué)網(wǎng)
- < /div>
/- php自學(xué)網(wǎng)2
- < /div>
- < div id="biuuu_3">
- php自學(xué)網(wǎng)3
- < /div>';
#t#PHP函數(shù)preg_match_all實例要求:分別將每一個DIV元素的ID和內(nèi)容取出,如biuuu,biuuu_2,biuuu_3,php自學(xué)網(wǎng),php自學(xué)網(wǎng)2和php自學(xué)網(wǎng)3(一些常用的抓站方法就是這樣匹配的)
分析:字符串是一個簡單的HTML元素,每一個DIV元素對應(yīng)該一個ID和內(nèi)容,并且是獨立的,首先考慮如何取出一個DIV內(nèi)的ID值和內(nèi)容, 如:php自學(xué)網(wǎng),然后匹配其它類似的元素。一個DIV中需要取出兩個值,也就是兩個匹配的表達式,第一個表達式用于匹配ID值(biuuu),第二個表 達式用于匹配ID的內(nèi)容(php自學(xué)網(wǎng)),正則表達式常用的表達式使用小括號,那么前面的元素將會變成如下形式:
- < div
- id="(biuuu)">
- (php自學(xué)網(wǎng))
- < /div>
- < div id="(表達式1)">
- (表達式2)
- < /div>
好,使用如上小括號把需要匹配的區(qū)域進行了劃分,接下來就是如何匹配各個表達式內(nèi)的內(nèi)容,我們猜想一個ID可能是字母,數(shù)字或下劃線,那這就變得簡單了,使用中括號就可以實現(xiàn),如下:
表達式1:[a-zA-Z0-9_]+ (表示匹配大小寫字母,數(shù)字和下劃線)
那如何匹配表達式2,因為ID的內(nèi)容可以是任意的字符,但是要注意,不能匹配<或>字符,因為如果匹配這兩個字符將會把后面使用的DIV都匹配出來,因此需要排除這兩個字符開始的元素,也就是不匹配以<或>字符,如下:
表達式2:[^<>]+ (表示不匹配<和>字符)
這樣,PHP函數(shù)preg_match_all需要匹配的子表達式就實現(xiàn)了,但是還要需要匹配一個的表達式,方法如下:
表達式:/ '"(表達式1)"'>(表達式2)
注意其中的雙引號"和/需要使用轉(zhuǎn)義字符轉(zhuǎn)義,然后把前面兩個表達式放進去,如下:
- '"([a-z0-9_]+)"'>/
- < div id="([a-z0-9_]+)">
- ([^<>]+)
- < /div>/
這樣就實現(xiàn)一個匹配每一個DIV元素ID值和內(nèi)容的正則表達式,然后使用preg_match_all函數(shù)測試如下:
- $html =
- '< div id="biuuu">
- php自學(xué)網(wǎng)
- < /div>
- < div id="biuuu_2">
- php自學(xué)網(wǎng)2
- < /div>
- < div id="biuuu_3">
- php自學(xué)網(wǎng)3
- < /div>';
- preg_match_all('/
- < divsiddivsid="([a-z0-9_]+)">
- ([^<>]+)
- < /div>/',$html,$result);
- var_dump($result);
PHP函數(shù)preg_match_all示例結(jié)果:
- array(3) {
- [0]=> array(3)
- {
- [0]=> string(30) "
php自學(xué)網(wǎng)"- [1]=> string(33) "
php自學(xué)網(wǎng)2"- [2]=> string(33) "
php自學(xué)網(wǎng)3"- }
- [1]=> array(3)
- {
- [0]=> string(5) "biuuu"
- [1]=> string(7) "biuuu_2"
- [2]=> string(7) "biuuu_3"
- }
- [2]=> array(3)
- {
- [0]=> string(8) "php自學(xué)網(wǎng)"
- [1]=> string(9) "php自學(xué)網(wǎng)2"
- [2]=> string(9) "php自學(xué)網(wǎng)3"
- }
- }
共有三個表達式,分別顯示每一個表達式匹配的值,并以數(shù)組的形式存儲,這樣就把每一個DIV元素的ID和內(nèi)容取出。使用正則表達式最主要還是要知道需要什么,然后跟椐需要進行匹配,并且思路清晰,并適當(dāng)?shù)慕柚鶳HP函數(shù)preg_match_all進行輸出調(diào)試,非常方便。
網(wǎng)頁名稱:如何運用PHP函數(shù)preg_match_all測試正則表達式效果
文章位置:http://www.dlmjj.cn/article/dppgehg.html


咨詢
建站咨詢
