新聞中心
在寫正則表達式的時候總會遇到不少的問題, 特別是在表達式有多個元組的時候。下面看下re模塊下的findall()函數和多個表達式元組相遇的時候會出現什么樣的坑。

10多年的吉州網站建設經驗,針對設計、前端、開發(fā)、售后、文案、推廣等六對一服務,響應快,48小時及時工作處理。營銷型網站的優(yōu)勢是能夠根據用戶設備顯示端的尺寸不同,自動調整吉州建站的顯示方式,使網站能夠適用不同顯示終端,在瀏覽器中調整網站的寬度,無論在任何一種瀏覽器上瀏覽網站,都能展現優(yōu)雅布局與設計,從而大程度地提升瀏覽體驗。創(chuàng)新互聯(lián)公司從事“吉州網站設計”,“吉州網站推廣”以來,每個客戶項目都認真落實執(zhí)行。
代碼如下
import re
str="a b c d"
regex0=re.compile("((\w+)\s+\w+)")
print(regex0.findall(str))
regex1=re.compile("(\w+)\s+\w+")
print(regex1.findall(str))
regex2=re.compile("\w+\s+\w+")
print(regex2.findall(str))輸出結果
[('a b', 'a'), ('c d', 'c')]
['a', 'c']
['a b', 'c d']可能結果有點意外,下面解釋一下
第一個正則表達式中是帶有2個括號的,我們可以看到其輸出是一個list 中包含2個 tuple
第二個正則表達式中帶有1個括號,其輸出的內容就是括號匹配到的內容,而不是整個表達式所匹配到的結果。
第三個正則表達式中不帶有括號,其輸出的內容就是整個表達式所匹配到的內容。
結論:findall()返回的是括號所匹配到的結果(如regex1),多個括號就會返回多個括號分別匹配到的結果(如regex),如果沒有括號就返回就返回整條語句所匹配到的結果(如regex2)。所以在提取數據的時候就需要注意這個坑。
實際上是由其并不是python特有的,這是 正則 所特有的 , 任何一門高級語言使用正則都滿足這個特點:有括號時只能匹配到括號中的內容,沒有括號【相當于在最外層增加了一個括號】。在正則里面 “()” 代表的是分組的意思,一個括號代表一個分組,你只能匹配到"()"中的內容。
分享名稱:創(chuàng)新互聯(lián)Python教程:Python正則表達式findall函數詳解
鏈接地址:http://www.dlmjj.cn/article/djepggd.html


咨詢
建站咨詢
