新聞中心
要用Python爬取圖片,我們可以使用requests庫(kù)和BeautifulSoup庫(kù),以下是詳細(xì)的技術(shù)教學(xué):

10年建站經(jīng)驗(yàn), 成都網(wǎng)站建設(shè)、成都網(wǎng)站設(shè)計(jì)客戶(hù)的見(jiàn)證與正確選擇。創(chuàng)新互聯(lián)建站提供完善的營(yíng)銷(xiāo)型網(wǎng)頁(yè)建站明細(xì)報(bào)價(jià)表。后期開(kāi)發(fā)更加便捷高效,我們致力于追求更美、更快、更規(guī)范。
1、確保已經(jīng)安裝了requests和BeautifulSoup庫(kù),如果沒(méi)有安裝,可以使用以下命令進(jìn)行安裝:
pip install requests pip install beautifulsoup4
2、導(dǎo)入所需庫(kù):
import requests from bs4 import BeautifulSoup import os
3、定義一個(gè)函數(shù),用于下載圖片:
def download_image(url, save_path):
response = requests.get(url)
with open(save_path, 'wb') as f:
f.write(response.content)
4、定義一個(gè)函數(shù),用于獲取網(wǎng)頁(yè)中的所有圖片鏈接:
def get_image_urls(url):
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
img_tags = soup.find_all('img')
img_urls = [img['src'] for img in img_tags if 'src' in img.attrs]
return img_urls
5、定義主函數(shù),用于爬取網(wǎng)頁(yè)中的所有圖片:
def main(url, save_dir):
if not os.path.exists(save_dir):
os.makedirs(save_dir)
img_urls = get_image_urls(url)
for img_url in img_urls:
save_path = os.path.join(save_dir, img_url.split('/')[1])
download_image(img_url, save_path)
print(f'下載完成:{img_url} > {save_path}')
6、調(diào)用主函數(shù),開(kāi)始爬取圖片:
if __name__ == '__main__':
url = 'https://www.example.com' # 替換為目標(biāo)網(wǎng)站的URL
save_dir = 'images' # 圖片保存的文件夾名稱(chēng)
main(url, save_dir)
將以上代碼保存為一個(gè)Python文件,例如download_images.py,然后在命令行中運(yùn)行該文件,即可開(kāi)始爬取圖片,注意將url變量替換為目標(biāo)網(wǎng)站的URL。
文章題目:如何用python爬取圖片
網(wǎng)站地址:http://www.dlmjj.cn/article/coddejp.html


咨詢(xún)
建站咨詢(xún)
