日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

RELATEED CONSULTING
相關咨詢
選擇下列產品馬上在線溝通
服務時間:8:30-17:00
你可能遇到了下面的問題
關閉右側工具欄

新聞中心

這里有您想知道的互聯網營銷解決方案
創(chuàng)新互聯Python教程:pythonxml解析中文亂碼怎么辦

用python解析XML文件,出現異常信息如下:

創(chuàng)新互聯是一家集網站建設,福貢企業(yè)網站建設,福貢品牌網站建設,網站定制,福貢網站建設報價,網絡營銷,網絡優(yōu)化,福貢網站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強企業(yè)競爭力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯網需求。同時我們時刻保持專業(yè)、時尚、前沿,時刻以成就客戶成長自我,堅持不斷學習、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實用型網站。

xml.parsers.expat.ExpatError: not well-formed (invalid token): line 13, column 31

相關推薦:《Python入門教程》

解決方式:

將文件重新編碼成utf-8格式就可以了。

在linux下一種取巧的解決方式:

對于中文,這里選了一種取巧的方法。即先通過iconv命令將xml文件變成utf-8格式,然后將xml中指定編碼格式的內容去掉即可。

可參考如下代碼:

cmd = "iconv " + filename + " -t \"utf-8\" >utf.tmp"
os.system(cmd)
utf_filename = "utf.tmp"
f = open(utf_filename)
data = f.read()
f.close()
os.system("rm -f utf.tmp")
#----delete the encode type in  xml file-----
#result = re.sub(regex, newstring, subject)
data = data.replace('encoding="GB2312"', '')
data = data.replace('encoding="gb2312"', '')
#self.dom.unlink
self.dom = xml.dom.minidom.parseString( data )

新聞標題:創(chuàng)新互聯Python教程:pythonxml解析中文亂碼怎么辦
標題鏈接:http://www.dlmjj.cn/article/dhhssse.html