新聞中心
經(jīng)過小伙伴們的提醒,小編發(fā)現(xiàn)編碼方面少講了一個基礎(chǔ)知識,所以有的小伙伴對這方面的內(nèi)容比較模糊,這就讓小編有點尷尬了。收到大家的催促,小編馬上就整理出了編碼類型的資料,內(nèi)容方面都是經(jīng)過精簡的,便于小伙伴們的閱讀。在本篇的整理上,知識點的分析較以往會豐富一點。今天就Python3里編碼的幾個類型和轉(zhuǎn)換的方法,小編會進行詳細的講解。

成都創(chuàng)新互聯(lián)公司專注于企業(yè)網(wǎng)絡(luò)營銷推廣、網(wǎng)站重做改版、三臺網(wǎng)站定制設(shè)計、自適應(yīng)品牌網(wǎng)站建設(shè)、HTML5、商城建設(shè)、集團公司官網(wǎng)建設(shè)、成都外貿(mào)網(wǎng)站建設(shè)、高端網(wǎng)站制作、響應(yīng)式網(wǎng)頁設(shè)計等建站業(yè)務(wù),價格優(yōu)惠性價比高,為三臺等各大城市提供網(wǎng)站開發(fā)制作服務(wù)。
1.Python和unicode
為了正確處理多語言文本,Python在2.0版后引入了Unicode字符串。
2.python中的print
雖然python內(nèi)部需要將文本編碼轉(zhuǎn)換為unicode編碼來處理,而終端顯示工作則由傳統(tǒng)的Python字符串完成(實際上,Python的print語句根本無法打印出雙字節(jié)的Unicode編碼字符)。
python的print會對輸出的unicode編碼(對其它非unicode編碼,print會原樣輸出)做自動的編碼轉(zhuǎn)換(輸出到控制臺時),而文件對象的write方法就不會做,因此,當(dāng)一些字符串用print輸出正常時,write到文件確不一定和print的一樣。
在linux下是按照環(huán)境變量來轉(zhuǎn)換的,在linux下使用locale命令就可以看到。print語句它的實現(xiàn)是將要輸出的內(nèi)容傳送了操作系統(tǒng),操作系統(tǒng)會根據(jù)系統(tǒng)的編碼對輸入的字節(jié)流進行編碼。
>>>str='學(xué)習(xí)python' >>> str '\xe5\xad\xa6\xe4\xb9\xa0python' #asII編碼 >>> print str 學(xué)習(xí)python >>> str=u'學(xué)習(xí)python' >>> str ####unicode編碼 '\xe5u\xad\xa6\xe4\xb9\xa0python'
3. python中的decode
將其他字符集轉(zhuǎn)化為unicode編碼(只有中文字符才需要轉(zhuǎn)換)
>>> str='學(xué)習(xí)'
>>> ustr=str.decode('utf-8')
>>> ustr
u'\u5b66\u4e60'
這樣就對中文字符進行了編碼轉(zhuǎn)換,可用python進行后續(xù)的處理;(如果不轉(zhuǎn)換的話,python會根據(jù)機器的環(huán)境變量進行默認(rèn)的編碼轉(zhuǎn)換,這樣就可能出現(xiàn)亂碼)
4.python中的encode
將unicode轉(zhuǎn)化為其它字符集
>>> str='學(xué)習(xí)'
>>> ustr=str.decode('utf-8')
>>> ustr
u'\u5b66\u4e60'
>>> ustr.encode('utf-8')
'\xe5\xad\xa6\xe4\xb9\xa0'
>>> print ustr.encode('utf-8')
以上就是Python3編碼的4種類型,同時帶了轉(zhuǎn)換的方法。如果有其他更好的方法,小編也會在后續(xù)更新出來的。本篇編碼類型方面是基礎(chǔ)的python知識,小伙伴們學(xué)習(xí)的時候一定要加強記憶。
網(wǎng)站欄目:創(chuàng)新互聯(lián)Python教程:Python3編碼類型有哪些?怎么轉(zhuǎn)換?
網(wǎng)頁URL:http://www.dlmjj.cn/article/dppcicd.html


咨詢
建站咨詢
