新聞中心
0 前言

說到處理循環(huán),我們習慣使用for, while等,比如依次打印每個列表中的字符:
在打印內(nèi)容字節(jié)數(shù)較小時,全部載入內(nèi)存后,再打印,沒有問題??墒?,如果現(xiàn)在有成千上百萬條車輛行駛軌跡,叫你分析出其中每個客戶的出行規(guī)律,堵車情況等,假如是在單機上處理這件事。
你可能首先要面臨,也可能被你忽視,最后代碼都寫好后,才可能暴露出的一個問題:outofmemory, 這在實際項目中經(jīng)常遇到。
這個問題提醒我們,處理數(shù)據(jù)時,如何寫出高效利用內(nèi)存的程序,就顯得很重要。今天,我們就來探討如何高效利用內(nèi)存,節(jié)省內(nèi)存同時還能把事情辦好。
其實,Python已經(jīng)準備好一個模塊專門用來處理這件事,它就是itertools 模塊,這里面幾個函數(shù)的功能其實很好理解。
我不打算籠統(tǒng)的介紹它們所能實現(xiàn)的功能,而是想分析這些功能背后的實現(xiàn)代碼,它們?nèi)绾巫龅礁咝Ч?jié)省內(nèi)存的,Python內(nèi)核的貢獻者們又是如何寫出一手漂亮的代碼的,這很有趣,不是嗎?
OK,let's go. Hope you enjoy the journey!
1 拼接元素
itertools 中的chain 函數(shù)實現(xiàn)元素拼接,原型如下,參數(shù)*表示個數(shù)可變的參數(shù)
chain(iterables)
應用如下:
哇,不能再好用了,它有點join的味道,但是比join強,它的重點在于參數(shù)都是可迭代的實例。
那么,chain如何實現(xiàn)高效節(jié)省內(nèi)存的呢?chain大概的實現(xiàn)代碼如下:
以上代碼不難理解,chain本質(zhì)返回一個生成器,所以它實際上是一次讀入一個元素到內(nèi)存,所以做到最高效地節(jié)省內(nèi)存。
2 逐個累積
返回列表的累積匯總值,原型:
accumulate(iterable[, func, *, initial=None])
應用如下:
accumulate大概的實現(xiàn)代碼如下:
以上代碼,你還好嗎?與chain簡單的yield不同,此處稍微復雜一點,yield有點像return,所以 yield total那行直接就返回一個元素,也就是iterable的第一個元素,因為任何時候這個函數(shù)返回的第一個元素就是它的第一個。又因為yield返回的是一個generator對象,比如名字gen,所以next(gen)時,代碼將會執(zhí)行到 for element in it:這行,而此時的迭代器it 已經(jīng)指到iterable的第二個元素,OK,相信你懂了!
3 漏斗篩選
它是compress 函數(shù),功能類似于漏斗功能,所以我稱它為漏斗篩選,原型:
compress(data, selectors)
容易看出,compress返回的元素個數(shù)等于兩個參數(shù)中較短的列表長度。
它的大概實現(xiàn)代碼:
這個函數(shù)非常好用
4 段位篩選
掃描列表,不滿足條件處開始往后保留,原型如下:
dropwhile(predicate, iterable)
應用例子:
實現(xiàn)它的大概代碼如下:
5 段位篩選2
掃描列表,只要滿足條件就從可迭代對象中返回元素,直到不滿足條件為止,原型如下:
takewhile(predicate, iterable)
應用例子:
實現(xiàn)它的大概代碼如下:
6 次品篩選
掃描列表,只要不滿足條件都保留,原型如下:
dropwhile(predicate, iterable)
應用例子:
實現(xiàn)它的大概代碼如下:
7 切片篩選
Python中的普通切片操作,比如:
它們的缺陷還是lis 必須全部載入內(nèi)存,所以更節(jié)省內(nèi)存的操作islice,原型如下:
islice(iterable, start, stop[, step])
應用例子:
實現(xiàn)它的大概代碼如下:
巧妙利用生成器迭代結(jié)束時會拋出異常StopIteration,做一些邊界處理的事情。
8 細胞分裂
tee函數(shù)類似于我們熟知的細胞分裂,它能復制原迭代器n個,原型如下:
tee(iterable, n=2)
應用如下,可以看出復制出的兩個迭代器是獨立的
實現(xiàn)它的代碼大概如下:
tee 實現(xiàn)內(nèi)部使用一個隊列類型deques,起初生成空隊列,向復制出來的每個隊列中添加元素newval, 同時yield 當前被調(diào)用的mydeque中的最左元素。
9 map變體
starmap可以看做是map的變體,它能更加節(jié)省內(nèi)存,同時iterable的元素必須也為可迭代對象,原型如下:
starmap(function, iterable)
應用它:
starmap的實現(xiàn)細節(jié)如下:
10 復制元素
repeat實現(xiàn)復制元素n次,原型如下:
repeat(object[, times])
應用如下:
它的實現(xiàn)細節(jié)大概如下:
11 笛卡爾積
笛卡爾積實現(xiàn)的效果同下:
所以,笛卡爾積的實現(xiàn)效果如下:
它的實現(xiàn)細節(jié):
12 加強版zip
組合值。若可迭代對象的長度未對齊,將根據(jù) fillvalue 填充缺失值,注意:迭代持續(xù)到耗光最長的可迭代對象,效果如下:
它的實現(xiàn)細節(jié):
它里面使用repeat,也就是在可迭代對象的長度未對齊時,根據(jù) fillvalue 填充缺失值。理解上面代碼的關鍵是迭代器對象(iter),next方法的特殊性:
結(jié)合這個提示再理解上面代碼,就不會吃力。
名稱欄目:Python循環(huán)12種超強寫法,又快又省內(nèi)存
網(wǎng)址分享:http://www.dlmjj.cn/article/coeodje.html


咨詢
建站咨詢
