新聞中心
編碼方式的歷史大致為ASCII ->gb2312->unicode->utf-8,期間具體詳細(xì)信息感興趣的可以去做一些查詢,正因?yàn)榇嬖谶@樣的過渡,因此對(duì)同一模塊的不同使用,需要我們?nèi)ミM(jìn)行有選擇性的挑選使用,因此,這就衍生出了我們今天的主題,怎么去對(duì)比使用這些存在的編碼方式。

創(chuàng)新互聯(lián)是網(wǎng)站建設(shè)技術(shù)企業(yè),為成都企業(yè)提供專業(yè)的做網(wǎng)站、成都網(wǎng)站制作,網(wǎng)站設(shè)計(jì),網(wǎng)站制作,網(wǎng)站改版等技術(shù)服務(wù)。擁有十載豐富建站經(jīng)驗(yàn)和眾多成功案例,為您定制適合企業(yè)的網(wǎng)站。十載品質(zhì),值得信賴!
來個(gè)編碼解碼的小例子先,記住中文可以進(jìn)行GBK和utf-8編碼,在GBk一個(gè)中文字符對(duì)應(yīng)兩個(gè)字節(jié),在utf-8一個(gè)中文字符對(duì)應(yīng)三個(gè)字節(jié),中文不能進(jìn)行ASCII編碼。
>>> '爬森'.encode('GBK')
b'\xc1\xf5\xc8\xf3\xc9\xad'
>>> '爬森'.encode('ascii')
Traceback (most recent call last):
File "", line 1, in
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128)
>>> 'Runsen'.encode('ascii')
b'Runsen'
>>> "爬森".encode('utf-8')
b'\xe5\x88\x98\xe6\xb6\xa6\xe6\xa3\xae'
>>> '爬森'.encode('GBK').decode('GBK')
'爬森'
>>> '爬森'.encode('GBK').decode('utf-8')
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc1 in position 0: invalid start byte
如果編碼解碼格式不一致可能會(huì)出現(xiàn)亂碼,encode表示編碼,decode表示解碼,這樣大家可以對(duì)選擇上有明確想法了吧,如果還想知道更多相關(guān)內(nèi)容,進(jìn)入python學(xué)習(xí)網(wǎng)即可。
網(wǎng)頁(yè)題目:創(chuàng)新互聯(lián)Python教程:python開發(fā)中的編碼方式如何對(duì)比使用?
文章網(wǎng)址:http://www.dlmjj.cn/article/dhhdisi.html


咨詢
建站咨詢
