新聞中心
相信平時(shí)各位小伙伴都是習(xí)慣用中文的人,就算英文水平不錯(cuò),畢竟還是中文用起來(lái)更順手一點(diǎn)。不過(guò)在計(jì)算機(jī)編程中,還是以英文為主,會(huì)給我們的實(shí)際操作帶來(lái)一些困擾。有時(shí)候中文也不能被計(jì)算機(jī)語(yǔ)言所識(shí)別,就會(huì)導(dǎo)致報(bào)錯(cuò)的出現(xiàn)。今天就python3中文轉(zhuǎn)換url編碼的相關(guān)問(wèn)題,小編為大家?guī)?lái)一個(gè)示例的講解。

處理百度貼吧的東西。想要做一個(gè)關(guān)鍵詞的list,每次需要時(shí),直接添加
到list里面就可以了。但是添加到list里面是中文的情況(比如‘麗江'),url的地址編碼卻是'%E4%B8%BD%E6%B1%9F',因此需
要做一個(gè)轉(zhuǎn)換。這里我們就用到了模塊urllib。
>>> import urllib >>> data = '麗江' >>> print data 麗江 >>> data '\xe4\xb8\xbd\xe6\xb1\x9f' >>> urllib.quote(data) '%E4%B8%BD%E6%B1%9F'
那我們想轉(zhuǎn)回去呢?
>>> urllib.unquote('%E4%B8%BD%E6%B1%9F')
'\xe4\xb8\xbd\xe6\xb1\x9f'
>>> print urllib.unquote('%E4%B8%BD%E6%B1%9F')
麗江細(xì)心的同學(xué)會(huì)發(fā)現(xiàn)貼吧url中出現(xiàn)的是%C0%F6%BD%AD,而非'%E4%B8%BD%E6%B1%9F',其實(shí)是編碼問(wèn)題。百度的是gbk,其他的一般網(wǎng)站比如google就是utf8的。所以可以用下列語(yǔ)句實(shí)現(xiàn)。
>>> import sys,urllib
>>> s = '麗江'
>>> urllib.quote(s.decode(sys.stdin.encoding).encode('gbk'))
'%C0%F6%BD%AD'
>>> urllib.quote(s.decode(sys.stdin.encoding).encode('utf8'))
'%E4%B8%BD%E6%B1%9F'
>>>以上就是python3中文轉(zhuǎn)換url編碼的方法,是不是很實(shí)用呢~畢竟中文在編程里面想轉(zhuǎn)換不是一件容易的事情。學(xué)會(huì)了的小伙伴趕緊保存起來(lái),不然下次又要重新找解決的辦法啦。
新聞標(biāo)題:創(chuàng)新互聯(lián)Python教程:python3如何中文轉(zhuǎn)換編碼?
當(dāng)前網(wǎng)址:http://www.dlmjj.cn/article/djddcps.html


咨詢(xún)
建站咨詢(xún)
