中文字幕婷婷五夜天,久久视频一二三潘金莲

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案

巧妙運用PHP函數(shù)實現(xiàn)采集器

PHP經(jīng)過長時間的發(fā)展，很多用戶都很了解PHP了，我們現(xiàn)在可以利用PHP函數(shù)實現(xiàn)采集器程序。何為采集器，通常又叫小偷程序，主要是用來抓取別人網(wǎng)頁內(nèi)容的。關于采集器的制作，其實并不難，就是遠程打開要采集的網(wǎng)頁，然后用正則表達式將需要的內(nèi)容匹配出來，只要稍微有點正則表達式的基礎，都能做出自己的采集器來的。

為加查等地區(qū)用戶提供了全套網(wǎng)頁設計制作服務，及加查網(wǎng)站建設行業(yè)解決方案。主營業(yè)務為成都網(wǎng)站設計、網(wǎng)站建設、加查網(wǎng)站設計，以傳統(tǒng)方式定制建設網(wǎng)站，并提供域名空間備案等一條龍服務，秉承以專業(yè)、用心的態(tài)度為用戶提供真誠的服務。我們深信只要達到每一位用戶的要求，就會得到認可，從而選擇與我們長期合作。這樣，我們也可以走得更遠！

#T#前幾天做了個小說連載的程序，因為怕更新麻煩，順帶就寫了個采集器，采集八路中文網(wǎng)的，功能比較簡單，不能自定義規(guī)則，不過大概思路都在里面了，自定義規(guī)則可以自己來擴展。用php來做采集器主要用到兩個PHP函數(shù)：file_get_contents()和preg_match_all()，前一個是遠程讀取網(wǎng)頁內(nèi)容的，不過只在php5以上的版本才能用，后一個是正則函數(shù)，用來提取需要的內(nèi)容的。面就一步一步來講功能實現(xiàn)。因為是采集小說，所以首先要將書名、作者、類型這三個提取出來，別的信息可根據(jù)需要提取。

這樣還不夠，還需要一個切取PHP函數(shù)：

 
 
  
  function cut($string,$start,$end){     
  
  $message = explode($start,$string);     
  
  $message = explode($end,$message[1]); return $message[0];}其中$string為要被切取的內(nèi)容，$start為開始的地方，$end為結束的地方。取出分類號：     
  
   
  
  $start = "Html/Book/";     
  
  $end    
  
  = "List.shtm";     
  
  $typeid = cut($typeid[0][0],$start,$end);     
  
  $typeid = explode("/",$typeid);[/php]     
  
   
  
  這樣，$typeid[0]就是我們要找的分類號了。方法如下：     
  
   
  
  $ustart = "\"";     
  
  $uend    
  
  = "\"";     
  
  //t表示title的縮寫     
  
  $tstart = ">";     
  
  $tend    
  
  = "<";     
  
  //取路徑,例如:123.shtm,2342.shtm,233.shtm     
  
  preg_match_all("/\"[0-9]{1,}\.(shtm)\"/is",$chapterurl,$url);     
  
  //取標題,例如:***章 九世善人     
  
  preg_match_all("/ href=\"[0-9]{1,}\.shtm\"(.*?)\<\/a>/is",$file,$title);     

  
  $countcountcount = count($url[0]);     
  
  for($i=0;$i<=$count;$i++)     
  
  {     
  
  $u = cut($url[0][$i],$ustart,$uend);     
  
  $t = cut($title[0][$i],$tstart,$tend);     
  
  $array[$u] = $t;     
  
  }

$array數(shù)組就是所有的章節(jié)地址了，到這里，采集器就完成一半了，剩下的就是循環(huán)打開每個章節(jié)地址，讀取，然后將內(nèi)容匹配出來。這個比較簡單，這里就不詳細敘述了。好了，今天就先寫到這吧，***次寫這么長的文章，語言組織方面難免有問題，還請大家多包涵！

分享文章：巧妙運用PHP函數(shù)實現(xiàn)采集器
網(wǎng)站鏈接：http://www.dlmjj.cn/article/cdispig.html

日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

新聞中心

其他資訊