欧洲一级夜夜爽老妇人,青青草原亚洲欧美,成人嫩草视频HD

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案

創(chuàng)新互聯(lián)Python教程：Python中怎么處理字符編碼問題

python中可以使用base64來處理字符編碼問題，Base64是一種用64個(gè)字符來表示任意二進(jìn)制數(shù)據(jù)的方法。

目前成都創(chuàng)新互聯(lián)公司已為1000+的企業(yè)提供了網(wǎng)站建設(shè)、域名、虛擬主機(jī)、網(wǎng)站托管維護(hù)、企業(yè)網(wǎng)站設(shè)計(jì)、新榮網(wǎng)站維護(hù)等服務(wù)，公司將堅(jiān)持客戶導(dǎo)向、應(yīng)用為本的策略，正道將秉承"和諧、參與、激情"的文化，與客戶和合作伙伴齊心協(xié)力一起成長，共同發(fā)展。

用記事本打開exe、jpg、pdf這些文件時(shí)，我們都會看到一大堆亂碼，因?yàn)槎M(jìn)制文件包含很多無法顯示和打印的字符，所以，如果要讓記事本這樣的文本處理軟件能處理二進(jìn)制數(shù)據(jù)，就需要一個(gè)二進(jìn)制到字符串的轉(zhuǎn)換方法。Base64是一種最常見的二進(jìn)制編碼方法。

Base64的原理很簡單，首先，準(zhǔn)備一個(gè)包含64個(gè)字符的數(shù)組：

['A', 'B', 'C', ... 'a', 'b', 'c', ... '0', '1', ... '+', '/']

然后，對二進(jìn)制數(shù)據(jù)進(jìn)行處理，每3個(gè)字節(jié)一組，一共是3x8=24bit，劃為4組，每組正好6個(gè)bit

這樣我們得到4個(gè)數(shù)字作為索引，然后查表，獲得相應(yīng)的4個(gè)字符，就是編碼后的字符串。

所以，Base64編碼會把3字節(jié)的二進(jìn)制數(shù)據(jù)編碼為4字節(jié)的文本數(shù)據(jù)，長度增加33%，好處是編碼后的文本數(shù)據(jù)可以在郵件正文、網(wǎng)頁等直接顯示。

如果要編碼的二進(jìn)制數(shù)據(jù)不是3的倍數(shù)，最后會剩下1個(gè)或2個(gè)字節(jié)怎么辦？Base64用\x00字節(jié)在末尾補(bǔ)足后，再在編碼的末尾加上1個(gè)或2個(gè)=號，表示補(bǔ)了多少字節(jié)，解碼的時(shí)候，會自動去掉。

Python內(nèi)置的base64可以直接進(jìn)行base64的編解碼：

>>> import base64
>>> base64.b64encode('binary\x00string')
'YmluYXJ5AHN0cmluZw=='
>>> base64.b64decode('YmluYXJ5AHN0cmluZw==')
'binary\x00string'

由于標(biāo)準(zhǔn)的Base64編碼后可能出現(xiàn)字符+和/，在URL中就不能直接作為參數(shù)，所以又有一種"url safe"的base64編碼，其實(shí)就是把字符+和/分別變成-和_：

>>> base64.b64encode('i\xb7\x1d\xfb\xef\xff')
'abcd++//'
>>> base64.urlsafe_b64encode('i\xb7\x1d\xfb\xef\xff')
'abcd--__'
>>> base64.urlsafe_b64decode('abcd--__')
'i\xb7\x1d\xfb\xef\xff'

還可以自己定義64個(gè)字符的排列順序，這樣就可以自定義Base64編碼，不過，通常情況下完全沒有必要。

Base64是一種通過查表的編碼方法，不能用于加密，即使使用自定義的編碼表也不行。

Base64適用于小段內(nèi)容的編碼，比如數(shù)字證書簽名、Cookie的內(nèi)容等。

由于=字符也可能出現(xiàn)在Base64編碼中，但=用在URL、Cookie里面會造成歧義，所以，很多Base64編碼后會把=去掉：

# 標(biāo)準(zhǔn)Base64:
'abcd' -> 'YWJjZA=='
# 自動去掉=:
'abcd' -> 'YWJjZA'

去掉=后怎么解碼呢？因?yàn)锽ase64是把3個(gè)字節(jié)變?yōu)?個(gè)字節(jié)，所以，Base64編碼的長度永遠(yuǎn)是4的倍數(shù)，因此，需要加上=把Base64字符串的長度變?yōu)?的倍數(shù)，就可以正常解碼了。

請寫一個(gè)能處理去掉=的base64解碼函數(shù)：

>>> base64.b64decode('YWJjZA==')
'abcd'
>>> base64.b64decode('YWJjZA')
Traceback (most recent call last):
 ...
TypeError: Incorrect padding
>>> safe_b64decode('YWJjZA')
'abcd'

小結(jié)

Base64是一種任意二進(jìn)制到文本字符串的編碼方法，常用于在URL、Cookie、網(wǎng)頁中傳輸少量二進(jìn)制數(shù)據(jù)。

名稱欄目：創(chuàng)新互聯(lián)Python教程：Python中怎么處理字符編碼問題
網(wǎng)頁URL：http://www.dlmjj.cn/article/dhijspd.html

日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

新聞中心

其他資訊