日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

RELATEED CONSULTING
相關咨詢
選擇下列產(chǎn)品馬上在線溝通
服務時間:8:30-17:00
你可能遇到了下面的問題
關閉右側工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
Python文本亂碼發(fā)生時的解決方案

Python文本亂碼這個問題在我們使用的時候會發(fā)生在很多地方,其實我們需要不斷的進行相關代碼的調整,在下面的文章中你會找到相關的解決方法。希望大家詳仔細的學習。

在處理utf8文本格式的時候,由于這些文本是含BOM(byte order mark)的utf8文本,編譯時產(chǎn)生一個Error,”UnicodeEncodeError: ‘gbk’ codec can’t encode character u’\ufeff’ in position 0: illegal multibyte sequence”

原來,某些軟件,如notepad,在保存一個以UTF-8編碼的文件時,會在文件開始的地方插入三個不可見的字符(0xEF 0xBB 0xBF,即BOM)。 因此我們在讀取時需要自己去掉這些字符,Python中的codecs module定義了這個常量:

查看源代碼打印幫助

 
 
 
  1. import codecs 
  2. data = open("Test.txt").read() 
  3. if data[:3] == codecs.BOM_UTF8: 
  4. datadata = data[3:] 
  5. print data.decode("utf-8") 

以上就是對Python文本亂碼發(fā)生時代碼修改的詳細介紹。


本文標題:Python文本亂碼發(fā)生時的解決方案
URL地址:http://www.dlmjj.cn/article/dhcjpsg.html