新聞中心
本文實(shí)例講述了Python編碼類型轉(zhuǎn)換方法如下:

創(chuàng)新互聯(lián)是一家專業(yè)提供巨鹿企業(yè)網(wǎng)站建設(shè),專注與成都網(wǎng)站設(shè)計(jì)、成都網(wǎng)站建設(shè)、H5開(kāi)發(fā)、小程序制作等業(yè)務(wù)。10年已為巨鹿眾多企業(yè)、政府機(jī)構(gòu)等服務(wù)。創(chuàng)新互聯(lián)專業(yè)網(wǎng)絡(luò)公司優(yōu)惠進(jìn)行中。
1:Python和unicode
為了正確處理多語(yǔ)言文本,Python在2.0版后引入了Unicode字符串。
2:python中的print
雖然python內(nèi)部需要將文本編碼轉(zhuǎn)換為unicode編碼來(lái)處理,而終端顯示工作則由傳統(tǒng)的Python字符串完成(實(shí)際上,Python的print
語(yǔ)句根本無(wú)法打印出雙字節(jié)的Unicode編碼字符)。
python的print會(huì)對(duì)輸出的unicode編碼(對(duì)其它非unicode編碼,print會(huì)原樣輸出)做自動(dòng)的編碼轉(zhuǎn)換(輸出到控制臺(tái)時(shí)),而文件對(duì)象
的write方法就不會(huì)做,因此,當(dāng)一些字符串用print輸出正常時(shí),write到文件確不一定和print的一樣。
在linux下是按照環(huán)境變量來(lái)轉(zhuǎn)換的,在linux下使用locale命令就可以看到。print語(yǔ)句它的實(shí)現(xiàn)是將要輸出的內(nèi)容傳送了操作系統(tǒng),操作
系統(tǒng)會(huì)根據(jù)系統(tǒng)的編碼對(duì)輸入的字節(jié)流進(jìn)行編碼。
>>>str='學(xué)習(xí)python' >>> str '\xe5\xad\xa6\xe4\xb9\xa0python' #asII編碼 >>> print str 學(xué)習(xí)python >>> str=u'學(xué)習(xí)python' >>> str ####unicode編碼 '\xe5u\xad\xa6\xe4\xb9\xa0python'
3: python中的decode
將其他字符集轉(zhuǎn)化為unicode編碼(只有中文字符才需要轉(zhuǎn)換)
>>> str='學(xué)習(xí)'
>>> ustr=str.decode('utf-8')
>>> ustr
u'\u5b66\u4e60'這樣就對(duì)中文字符進(jìn)行了編碼轉(zhuǎn)換,可用python進(jìn)行后續(xù)的處理;(如果不轉(zhuǎn)換的話,python會(huì)根據(jù)機(jī)器的環(huán)境變量進(jìn)行默認(rèn)的編碼轉(zhuǎn)換,這樣就可能出現(xiàn)亂碼)
4:python中的encode
將unicode轉(zhuǎn)化為其它字符集
>>> str='學(xué)習(xí)'
>>> ustr=str.decode('utf-8')
>>> ustr
u'\u5b66\u4e60'
>>> ustr.encode('utf-8')
'\xe5\xad\xa6\xe4\xb9\xa0'
>>> print ustr.encode('utf-8') 網(wǎng)頁(yè)題目:創(chuàng)新互聯(lián)Python教程:python中如何轉(zhuǎn)文件編碼格式
當(dāng)前URL:http://www.dlmjj.cn/article/dhedchc.html


咨詢
建站咨詢
