清纯可爱国产狼友第一,欧美激情丁香四射

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營(yíng)銷解決方案

用Python標(biāo)準(zhǔn)庫(kù)修改搜索引擎獲取結(jié)果

Python標(biāo)準(zhǔn)庫(kù)在長(zhǎng)時(shí)間的使用中需要不斷的學(xué)習(xí)。下面我們就看看如何才能更好的掌握相關(guān)的技術(shù)信息。希望對(duì)大家之后的使用和學(xué)習(xí)有所幫助。下面的就是想大家介紹下相關(guān)的使用方法。

公司主營(yíng)業(yè)務(wù)：成都網(wǎng)站設(shè)計(jì)、成都做網(wǎng)站、移動(dòng)網(wǎng)站開(kāi)發(fā)等業(yè)務(wù)。幫助企業(yè)客戶真正實(shí)現(xiàn)互聯(lián)網(wǎng)宣傳，提高企業(yè)的競(jìng)爭(zhēng)能力。創(chuàng)新互聯(lián)是一支青春激揚(yáng)、勤奮敬業(yè)、活力青春激揚(yáng)、勤奮敬業(yè)、活力澎湃、和諧高效的團(tuán)隊(duì)。公司秉承以“開(kāi)放、自由、嚴(yán)謹(jǐn)、自律”為核心的企業(yè)文化，感謝他們對(duì)我們的高要求，感謝他們從不同領(lǐng)域給我們帶來(lái)的挑戰(zhàn)，讓我們激情的團(tuán)隊(duì)有機(jī)會(huì)用頭腦與智慧不斷的給客戶帶來(lái)驚喜。創(chuàng)新互聯(lián)推出東光免費(fèi)做網(wǎng)站回饋大家。

我輸入的關(guān)鍵字作為地址參數(shù)傳遞給某個(gè)程序，這個(gè)程序就會(huì)返回一個(gè)頁(yè)面，上面包括頂部（logo和搜索UI）／結(jié)果部分／底部（版權(quán)信息部分），我們要得到的就是中間結(jié)果部分，這個(gè)可以用Python標(biāo)準(zhǔn)庫(kù)的urllib中的urlopen方法得到整個(gè)頁(yè)面的字符串，然后再解析這些字符串，完全有辦法把中間結(jié)果部分抽取出來(lái)，抽出著串字符串，加上自己的頭部和頂部和底部，那樣搜索小偷的雛形就大概完成了，下面先寫個(gè)測(cè)試代碼。

 
 
 
  
  
  [code]   
  
  
  # Search Thief   
  
  
  # creator: Singo   
  
  
  # date: 2007-8-24   
  
  
  import urllib   
  
  
  import re   
  
  
  class SearchThief:   
  
  
  " " "the google thief " " "   
  
  
  global path,targetURL   
  
  
  path = "pages\\ "   
  
  
  # targetURL = "http://www.google.cn/search?complete=1&hl=zh-CN&q= "   
  
  
  targetURL = "http://www.baidu.com/s?wd= "   
  
  
  def __init__(self,key):   
  
  
  self.key = key   
  
  
  def getPage(self):   
  
  
  webStr = urllib.urlopen(targetURL+self.key).read() # get the page string form the url   
  
  
  self.setPageToFile(webStr)   
  
  
  def setPageToFile(self,webStr):   
  
  
  rereSetStr = re.compile( "\r ")   
  
  
  self.key = reSetStr.sub( " ",self.key) # replace the string "\r "   
  
  
  targetFile = file(path+self.key+ ".html ", "w ") # open the file for "w "rite   
  
  
  targetFile.write(webStr)   
  
  
  targetFile.close()   
  
  
  print "done "   
  
  
  inputKey = raw_input( "Enter you want to search --> ")   
  
  
  obj = SearchThief(inputKey)   
  
  
  obj.getPage()   
  
  
  [/code]

這里只是要求用戶輸入一個(gè)關(guān)鍵字，然后向搜索引擎提交請(qǐng)求，把返回的頁(yè)面保存到一個(gè)目錄下，這只是一個(gè)測(cè)試的例子，如果要做真正的搜索小偷，完全可以不保存這個(gè)頁(yè)面，把抽取出來(lái)的字符串加入到我們預(yù)先設(shè)計(jì)好的模板里面，直接以web的形式顯示在客戶端，那樣就可以實(shí)現(xiàn)利用盜取某些搜索引擎的結(jié)果并構(gòu)造新的頁(yè)面呈現(xiàn)。

看一下百度搜索結(jié)果頁(yè)的源碼，在搜索結(jié)構(gòu)的那個(gè)table標(biāo)簽前面有個(gè)

的標(biāo)簽，我們可以根據(jù)這個(gè)標(biāo)簽得到下移兩行的結(jié)果集，于是增加一個(gè)方法。

 
 
 
  
  
  getResultStr()   
  
  
  [code]   
  
  
  def getResultStr(self,webStr):   
  
  
  webStrwebStrList = webStr.read().split( "\r\n ")   
  
  
  line = webStrList.index( "

")+2 # get the line from "

" move 2 line

resultStr = webStrList[line]

return resultStr

[/code]

既然得到結(jié)果列表，那么我們要把這個(gè)結(jié)果列表放到自己定義的頁(yè)面里面，我們可以說(shuō)這個(gè)頁(yè)面叫模板：

 
 
 
  
  
  [code]   
  
  
     
  
  
     
  
  
     
  
  
  < http-equivhttp-equiv= "Content-Type " content= "text/html; charset=gb2312 " />   
  
  
   SuperSingo搜索-%title%

工找到：×××條記錄，耗時(shí)×××秒

%result%

這里搜索的結(jié)構(gòu)全都是百度那里過(guò)來(lái)的哦！其中%title%和%result%是等待替換的字符，為了替換這些字符，我們?cè)僭黾右粋€(gè)方法， #p#

 
 
 
  
  
  [b]reCreatePage()：[/b]   
  
  
  [code]   
  
  
  def reCreatePage(self,resultStr):   
  
  
  demoStr = urllib.urlopen(demoPage).read() # get the demo page string   
  
  
  rereTitle = re.compile( "%title% ")   
  
  
  demoStr = reTitle.sub(self.key,demoStr) # re set the page title   
  
  
  rereResult = re.compile( "%result% ")   
  
  
  demoStr = reResult.sub(resultStr,demoStr) # re set the page result   
  
  
  return demoStr   
  
  
  [/code]

這樣就可以把模板中的%title%和%result%替換成我們想要的標(biāo)簽了。

 
 
 
  
  
  [code]   
  
  
  # the main programme   
  
  
  # creator: Singo   
  
  
  # date: 2007-8-24   
  
  
  import urllib   
  
  
  import re   
  
  
  class SearchThief:   
  
  
  " " "the google thief " " "   
  
  
  global path,targetURL,demoPage   
  
  
  path = "pages\\ "   
  
  
  # targetURL = "http://www.google.cn/search?complete=1&hl=zh-CN&q= "   
  
  
  targetURL = "http://www.baidu.com/s?wd= "   
  
  
  demoPage = path+ "__demo__.html "   
  
  
  def __init__(self,key):   
  
  
  self.key = key   
  
  
  def getPage(self):   
  
  
  webStr = urllib.urlopen(targetURL+self.key) # get the page string form the url   
  
  
  webStr = self.getResultStr(webStr) # get the result part   
  
  
  webStr = self.reCreatePage(webStr) # re create a new page   
  
  
  self.setPageToFile(webStr)   
  
  
  def getResultStr(self,webStr):   
  
  
  webStrwebStrList = webStr.read().split( "\r\n ")   
  
  
  line = webStrList.index( "

")+2 # get the line from "

這樣我們就可以得到一個(gè)自己定義的風(fēng)格而含有百度搜索出來(lái)的結(jié)果的頁(yè)面，這里只做了標(biāo)題和結(jié)果及的替換，同樣道理，我們還可以把“百度快照”替換掉，我們還可以重新生成翻頁(yè)控件,這樣一個(gè)搜索小偷就基本完成啦。

用Python標(biāo)準(zhǔn)庫(kù)向Google請(qǐng)求時(shí)，Google會(huì)返回一個(gè)不是我們希望得到的頁(yè)面，上面的內(nèi)容是提示無(wú)權(quán)訪問(wèn)，Google很聰明，這步已經(jīng)被他們想到了，但百度沒(méi)做這樣的限制哦，于是成功截取百度的數(shù)據(jù)。同樣道理，還可以嘗試其他搜索引擎，比如yisou和soso。

做個(gè)自己的頁(yè)面風(fēng)格，盜取baidu的搜索結(jié)果，打造自己的品牌而利用別人的數(shù)據(jù)，甚至去掉baidu的廣告加上自己的廣告，這種做法實(shí)在是太不厚道了，哈哈哈。該程序只為學(xué)習(xí)python標(biāo)準(zhǔn)庫(kù)用，具體來(lái)說(shuō)沒(méi)什么意義。

日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

新聞中心

其他資訊