日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時間:8:30-17:00
你可能遇到了下面的問題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
編寫高效內(nèi)存Python代碼的3個技巧

 介紹

創(chuàng)新互聯(lián)是一家專業(yè)提供晉江企業(yè)網(wǎng)站建設(shè),專注與網(wǎng)站設(shè)計制作、成都網(wǎng)站建設(shè)、H5建站、小程序制作等業(yè)務(wù)。10年已為晉江眾多企業(yè)、政府機(jī)構(gòu)等服務(wù)。創(chuàng)新互聯(lián)專業(yè)網(wǎng)站設(shè)計公司優(yōu)惠進(jìn)行中。

大多數(shù)時候,我們不需要優(yōu)化Python中的內(nèi)存使用情況。我們的程序太小而無法占用大量內(nèi)存,或者我們正在將數(shù)據(jù)存儲在程序外部的數(shù)據(jù)庫中。無論如何,在某些情況下,我們必須在內(nèi)存中保留過大的結(jié)構(gòu)或大量的對象。因此,我希望舉例說明可以減少程序內(nèi)存使用量的做法。

議程

  • 用__slots__限制類字段
  • Generator惰性加載
  • 用數(shù)組約束元素類型

用__slots__限制類字段

默認(rèn)情況下,每當(dāng)您在Python中創(chuàng)建對象時,即使在創(chuàng)建之后,您也能夠?qū)⑿伦侄翁砑拥綄ο蟆?/p>

例如,假設(shè)我有一個名為Dog的類:

 
 
  1. class Dog:  
  2.     def __init__(self, name, age):  
  3.     self.name = name  
  4.         self.age = age 
  5.     def main():  
  6.     dog = Dog("James", 5)  
  7.         dog.breed = "Pitbull"  
  8.         print(dog.breed) 
  9.  
  10. main() 

盡管名稱和年齡是我傳遞給構(gòu)造函數(shù)的唯一字段,但是請注意,在創(chuàng)建dog之后,如何初始化一個名為繁殖的新字段。本質(zhì)上,dog的字段存儲在內(nèi)部字典中,可通過.__ dict__訪問,并且在初始化dog.breed時,將其值為“ Pitbull”的字段“ breed”添加到內(nèi)部字典中。

 
 
  1. def main(): 
  2.     dog = Dog("James", 5) 
  3.     print(dog.__dict__)  
  4.     ''' 
  5.     output: {'name': 'James', 'age': 5} 
  6.     ''' 
  7.     dog.breed = "Pitbull" 
  8.     print(dog.__dict__) 
  9.     ''' 
  10.     output: {'name': 'James', 'age': 5, 'breed': 'Pitbull'} 
  11.     ''' 
  12. main() 

盡管這提供了靈活性,但大多數(shù)時候我們不需要在實(shí)例化之外添加新字段。為了節(jié)省內(nèi)存占用量,我們可以設(shè)置Dog的__slots__屬性來預(yù)定義其字段。

 
 
  1. class Dog: 
  2.     __slots__ = ("name", "age") 
  3.     def __init__(self, name, age): 
  4.         self.name = name 
  5.         self.age = age 

使用__slots__可以防止創(chuàng)建內(nèi)部字典,從而使我們可以更緊湊地存儲實(shí)例字段。但是,現(xiàn)在,我們不再能夠即時創(chuàng)建新字段。

 
 
  1. def main(): 
  2.     dog = Dog("James", 5) 
  3.     dog.breed = "Pitbull"  
  4.     ''' 
  5.     output: AttributeError:'Dog' object has no attribute 'breed' 
  6.     ''' 
  7.    
  8. main() 

為了測試__slots__的內(nèi)存使用情況,我創(chuàng)建了100,000個Dog和SlotDog對象。

 
 
  1. class Dog: 
  2.    
  3.   def __init__(self, name, age): 
  4.     self.name = name 
  5.     self.age = age 
  6. class SlotDog: 
  7.      
  8.    __slots__=("name", "age") 
  9.    def __init__(self, name, age): 
  10.      self.name = name 
  11.      self.age = age 

然后,我使用memory_profiler分解了創(chuàng)建100,000個對象后內(nèi)存使用量的增加情況。創(chuàng)建Dog對象后,內(nèi)存使用量增加了16.5 MiB,而SlotDog對象則增加了5.8 MiB,這表明使用__slots__有了很大的改進(jìn)。您可以在GitHub上查看創(chuàng)建代碼(https://github.com/Ramko9999/Medium-Memory-Efficient-Python/blob/main/slots_perf.py)。

在必須實(shí)例化具有預(yù)定字段的大量對象的情況下,使用__slots__將是有益的。

用Genertor惰性加載

當(dāng)使用大文件或集合時,可能無法加載整個文件或?qū)⒓暇S護(hù)在內(nèi)存中。如果我們可以一次處理多個文件或集合中的一個元素,那就太好了。

進(jìn)入生成器!

讓我們考慮一個例子。說我需要獲取前n個奇數(shù)進(jìn)行處理。自然地,我們可以創(chuàng)建一個列表并附加前n個奇數(shù)。

 
 
  1. def get_odds_list(n): 
  2.     odds = [] 
  3.     num = 1 
  4.     for i in range(n): 
  5.         odds.append(num) 
  6.         num += 2 
  7.     return odds 

但是,如果我們要處理前幾百萬的賠率,那么在內(nèi)存中維護(hù)此列表將變得昂貴。更好的方法是在我們計算賠率時利用生成器迭代賠率,而不是計算和存儲所有百萬賠率。

這是上面的函數(shù)作為生成器的樣子:

 
 
  1. def get_odds_generator(n): 
  2.     num = 1 
  3.     for i in range(n): 
  4.         yield num 
  5.         num += 2 
  6. odds = get_odds_generator(1000000) 

當(dāng)我們初始化賠率時,尚未計算任何奇數(shù)。此刻的賠率只是一個迭代器,一個值序列。為了訪問迭代器中的元素,我們必須在迭代器上調(diào)用next。顧名思義,next返回序列中的下一個值。

神奇之處在于yield關(guān)鍵字:它使函數(shù)成為生成器。本質(zhì)上,當(dāng)按賠率調(diào)用next時,生成器get_odds_generator將評估其代碼,直到達(dá)到y(tǒng)ield為止。然后,生成器將返回該值,并且其狀態(tài)將凍結(jié)。然后,再次調(diào)用next時,生成器將從中斷狀態(tài)重新開始評估其代碼。

 
 
  1. def get_odds_generator(n): 
  2.     num = 1 
  3.     for i in range(n): 
  4.         yield num 
  5.         num += 2 
  6.  
  7. odds = get_odds_generator(1000000) 
  8.  
  9. first = next(odds) 
  10. ''' 
  11. first = 1 
  12. Explanation: num is 1. We enter the for loop and immediately yield num 
  13. ''' 
  14.  
  15. second = next(odds) 
  16. ''' 
  17. second = 3  
  18. Explanation: num is 1. We add 2 to num, so its now 3.  
  19. We go the next iteration of the loop and yield num 
  20. ''' 
  21.  
  22. third = next(odds) 
  23. ''' 
  24. third = 5 
  25. Explanation: num is 3. We add 2 to num, so its now 5.  
  26. We go to the next iteration of the loop and yield num 
  27. ''' 

我們還可以按照以下方式瀏覽生成器生成的值。

 
 
  1. odds = get_odds_generator(1000000) 
  2. for odd in odds: 
  3.     pass //process the odd 

我們可以使用生成器來計算賠率。因此,我們不需要任何額外的內(nèi)存來存儲賠率。

使用生成器的一個警告是,我們將無法獲取先前的元素或跳過元素的序列。如果您需要訪問以前的元素,則最好直接使用列表。

用數(shù)組約束元素類型

盡管許多人認(rèn)為列表在Python中是數(shù)組,但實(shí)際上存在一個單獨(dú)的數(shù)組模塊。列表和數(shù)組之間的核心區(qū)別在于,數(shù)組僅限于一種類型的元素。

我們可以使用多種類型的值在Python中創(chuàng)建列表。

 
 
  1. lst = [1.0, 1, {}, "hi"] 

數(shù)組不是這種情況。我們必須使用類型代碼指定數(shù)組中元素的類型。類型代碼是代表數(shù)組類型的字符:“ i”代表整數(shù),“ b”代表字符,依此類推…

 
 
  1. from array import array 
  2. arr = array('i', []) # create an array of integers 
  3. arr.append(4) # append 4 to arr 
  4. arr.append('') # type error: integer is required not string 

數(shù)組與列表有很多共同的方法,例如append和pop(文檔)。數(shù)組的主要優(yōu)點(diǎn)是它們更加緊湊。為了測試這一點(diǎn),我制作了一個包含一百萬個整數(shù)的列表和數(shù)組,發(fā)現(xiàn)該列表的內(nèi)存使用量增加了19.5 MiB,而數(shù)組僅增加了4 MiB。簽出測量代碼(代碼)。

如果您有大量相同類型的數(shù)據(jù)序列,請考慮使用數(shù)組。

結(jié)論

過早的優(yōu)化是萬惡之源。

-唐納德·埃文·克努斯

我已經(jīng)展示了可以減少內(nèi)存占用的多種實(shí)踐,從使用__slots__到數(shù)組不等。僅在真正需要優(yōu)化內(nèi)存的最壞情況下考慮使用這些做法。在大多數(shù)情況下,不需要__slots__和數(shù)組。另一方面,標(biāo)準(zhǔn)API很可能已經(jīng)使用了生成器,因此您可以放輕松。


本文標(biāo)題:編寫高效內(nèi)存Python代碼的3個技巧
網(wǎng)站URL:http://www.dlmjj.cn/article/djpcgsc.html