日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時間:8:30-17:00
你可能遇到了下面的問題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
創(chuàng)新互聯(lián)Python教程:python如何解決中文亂碼問題

10年積累的做網(wǎng)站、網(wǎng)站建設(shè)經(jīng)驗,可以快速應對客戶對網(wǎng)站的新想法和需求。提供各種問題對應的解決方案。讓選擇我們的客戶得到更好、更有力的網(wǎng)絡(luò)服務(wù)。我雖然不認識你,你也不認識我。但先建設(shè)網(wǎng)站后付款的網(wǎng)站建設(shè)流程,更有仁化免費網(wǎng)站建設(shè)讓你可以放心的選擇與我們合作。

1、demo.py 文件和編碼聲明都為 GBK

這種方法比較笨,就是把 demo.py 文件改為 GBK 存儲,而且編碼聲明也是GBK,個人不推薦。

python學習網(wǎng),大量的免費python視頻教程,歡迎在線學習!

# encoding:gbk
s = "中文"
print s
print repr(s)

2、中文用 unicode 表示

只要在中文前面加上個小u標記,后面的中文就用 unicode 存儲了。

# encoding:utf-8
s = u"中文"
print s
print repr(s)

cmd 下是可以打印 unicode 字符的,如下:

相關(guān)推薦:《Python教程》

3、把中文強制轉(zhuǎn)換為GBK或者unicode編碼

強制轉(zhuǎn)換為unicode編碼,在 Python 中編碼是可以互相轉(zhuǎn)換的,比如從utf-8轉(zhuǎn)換為gbk,不同編碼之間不能直接轉(zhuǎn)換,需要通過unicode字符集中間過渡下,從上面基礎(chǔ)知識可知unicode是一種字符集,不屬于編碼,而utf-8是具體實現(xiàn)unicode思想的一種編碼。utf-8轉(zhuǎn)換為unicode是一種解碼過程,通過decode可從utf-8解碼成unicode。

# encoding:utf-8
s = "中文"
u = s.decode('utf-8')
print u
print type(u)
print repr(u)

強制轉(zhuǎn)換為gbk編碼,上一步已經(jīng)從utf-8轉(zhuǎn)換為unicode了,從unicode是編碼的過程,通過encode實現(xiàn)。

# encoding:utf-8
s = "中文"
u = s.decode('utf-8')
g = u.encode('gbk')
print g
print type(g)
print repr(g)

總結(jié)

windows cmd 窗口下不支持utf-8,想要顯示中文必須轉(zhuǎn)換為gbk或者unicode,而 Python idle 中這三種編碼都支持。中文亂碼的出現(xiàn)都是由于編碼不一致導致的,存儲的是用utf-8,打印的時候用gbk就會亂碼了,所有要保證不亂碼盡量保持統(tǒng)一,建議全部使用unicode。

decode 解碼

從其它編碼變成unicode叫解碼,解碼用的方法是decode,第一個參數(shù)為被解碼的字符串原始編碼格式,如果寫錯了也會報錯。比如 s 是utf-8,用gbk去解碼就會報錯。

# encoding:utf-8
s = "中文"
u = s.decode('gbk')
print u
print repr(u)

小提示

在 Python idle 和 cmd 下直接輸入 s = "中文"會以 gbk 編碼的,如果在文件中輸入 s = "中文"且文件存儲格式為utf-8,那么 s 是以utf-8編碼存儲的,有點不一樣曾經(jīng)踩過坑,及時 Python idle 成功了文件運行的時候也可能失敗。

encode 編碼

不可以直接從utf-8轉(zhuǎn)換為gbk,必須經(jīng)過unicode中間轉(zhuǎn)換,這點很重要,被編碼的原始字符串一定要為unicode,否則會報錯。

raw_input

raw_input 是獲取用戶輸入值的,獲取到的用戶輸入值和當前運行環(huán)境編碼有關(guān),比如 cmd 下默認編碼是 gbk,那么輸入的漢字就是以gbk編碼,而不管 demo.py 文件編碼格式和編碼聲明。

# encoding:utf-8
s = raw_input("input something: ")
print s
print type(s)
print repr(s)

GBK 編碼一個漢字兩個字節(jié),UTF-8 一個漢字通常3個字節(jié)。

細心的朋友已經(jīng)注意了,raw_input的提示語我用的是英文,那改成中文看看,果真出現(xiàn)亂碼了。

# encoding:utf-8
s = raw_input("請輸入中文漢字:")
print s
print type(s)
print repr(s)

怎么辦呢?把提示字符串強制為gbk編碼就好,unicode和utf-8都不可以。

# encoding:utf-8
s = raw_input(u"請輸入中文漢字:".encode('gbk'))
print s
print type(s)
print repr(s)

相等陷阱

“中文”這兩個字符串用不同的編碼存儲是不一樣的,utf-8編碼和gbk編碼存儲的“中文”都不一樣。

總結(jié)

想要不亂碼,記住以下5點法則:

(1)文件存儲為utf-8格式,編碼聲明為utf-8,# encoding:utf-8。

(2)出現(xiàn)漢字的地方前面加 u。

(3)不同編碼之間不能直接轉(zhuǎn)換,要經(jīng)過unicode中間跳轉(zhuǎn)。

(4)cmd 下不支持utf-8編碼。

(5)raw_input提示字符串只能為gbk編碼。


當前文章:創(chuàng)新互聯(lián)Python教程:python如何解決中文亂碼問題
標題路徑:http://www.dlmjj.cn/article/cdhcsjd.html