新聞中心
1、find_all()的爬取

創(chuàng)新互聯(lián)公司2013年成立,公司以成都做網(wǎng)站、成都網(wǎng)站建設(shè)、系統(tǒng)開發(fā)、網(wǎng)絡(luò)推廣、文化傳媒、企業(yè)宣傳、平面廣告設(shè)計(jì)等為主要業(yè)務(wù),適用行業(yè)近百種。服務(wù)企業(yè)客戶上千多家,涉及國(guó)內(nèi)多個(gè)省份客戶。擁有多年網(wǎng)站建設(shè)開發(fā)經(jīng)驗(yàn)。為企業(yè)提供專業(yè)的網(wǎng)站建設(shè)、創(chuàng)意設(shè)計(jì)、宣傳推廣等服務(wù)。 通過(guò)專業(yè)的設(shè)計(jì)、獨(dú)特的風(fēng)格,為不同客戶提供各種風(fēng)格的特色服務(wù)。
find_all():提取所有符合要求的數(shù)據(jù),搜索當(dāng)前tag的所有tag子節(jié)點(diǎn),并判斷是否符合過(guò)濾器的條件。
2、用法
bs對(duì)象.find_all(標(biāo)簽,屬性)
3、注意
bs對(duì)象、標(biāo)簽和屬性使用都與find()一致。但是,從find_all()中提取的數(shù)據(jù)類型與find()是不同的。通過(guò)find()方法提取的數(shù)據(jù)類型通常是Tag,而通過(guò)find_all提取的數(shù)據(jù)類型通常是ResultSet。碰到了Tag類型的數(shù)據(jù),我們可以通過(guò)Tag.text()來(lái)進(jìn)一步提取純文本格式的內(nèi)容,通過(guò)Tag['PropertyName']來(lái)提取特定屬性的值。當(dāng)遇到了ResultSet類型的數(shù)據(jù)時(shí),我就會(huì)想辦法通過(guò)遍歷進(jìn)一步提取所有符合條件的數(shù)據(jù)。
4、實(shí)例
# 最靈活的使用方式
li_quick = soup.find_all(attrs={'class':'item-1'})
for li_quick in li_quick:
print('最靈活的查找方法:',li_quick)以上就是用python爬取數(shù)據(jù)的方法,在之前我們已經(jīng)對(duì)find方法有所學(xué)習(xí),那么本篇find_all()也是比較簡(jiǎn)單和快速的爬取方法之一。更多Python學(xué)習(xí)指路:創(chuàng)新互聯(lián)python教程
(推薦操作系統(tǒng):windows7系統(tǒng)、Python 3.9.1,DELL G3電腦。)
網(wǎng)站標(biāo)題:創(chuàng)新互聯(lián)Python教程:如何用python爬取數(shù)據(jù)
文章分享:http://www.dlmjj.cn/article/cossdoe.html


咨詢
建站咨詢
