日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

RELATEED CONSULTING
相關咨詢
選擇下列產品馬上在線溝通
服務時間:8:30-17:00
你可能遇到了下面的問題
關閉右側工具欄

新聞中心

這里有您想知道的互聯(lián)網營銷解決方案
1分鐘帶你認識從"?"到"錕斤拷"

 [[378294]]

目前創(chuàng)新互聯(lián)已為超過千家的企業(yè)提供了網站建設、域名、網頁空間、成都網站托管、企業(yè)網站設計、懷柔網站維護等服務,公司將堅持客戶導向、應用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。

? 為何物?

在前不久石頭哥的這篇文章中 —— 你可能也會掉進這個簡單的 String 的坑,講述了因字符編碼問題而連續(xù)踩坑的經歷,文中有一個神奇的字符 “?”。

其實,這個 “?” 真是無處不在,比如大名鼎鼎的微信:

微信中的?

再比如,封面圖中,單價22元的“錕斤拷錕斤拷”,再隨便百度一把:

隨處可見的?

要弄清這個問題,還得先從編碼談起。

因為在計算機的眼里,都是二進制,具體用哪些二進制數(shù)字表示哪個符號,這就是編碼。不要把編碼想象得太復雜,其實就是一個很簡單的 mapping。

比如大家所熟知的 ASCII 編碼,規(guī)定了 二進制的0100 0001,也就是十進制的65,代表的含義就是大寫字母 A。

ASCII 編碼

? 也是一種編碼字符,就跟上面的 A 一樣一樣的,它是 UNICODE 編碼方式中的一個特殊的字符,也就是 0xFFFD(65533),語義是一個占位符,用來表達這套編碼系統(tǒng)中未知的,自己不認識的東西。

比如上篇文章中的實驗截圖的,紅色部分圈出來的對應的字符,UTF-8 編碼都不認識,所以按照 UNICODE 的定義,我就只好用統(tǒng)一的一個占位符 —— 0xFFFD(65533) 來表示。

為什么會出現(xiàn)“錕斤拷”?

我們接著上篇的例子來看, 如下圖所示,仍然從 “程序猿石頭” 對應二進制編碼截取部分:

如上圖所示,第 18 行的字節(jié)數(shù)組 new byte[] {-25, -119, -25, -116},UTF-8 恰好都不認識,因此只能用占位符替換。

??

這種情況,在編碼轉換過程中確實也比較常見,如果雙方沒溝通清楚,確實很容易出現(xiàn)互相不認識的情況。

在中文系統(tǒng)中,常見的字符編碼是 GBK,這個時候,因為大家沒提前商量清楚,我就默認按照 GBK 給你編碼看看。

“錕斤拷”在此

驚不驚喜意不意外……

其實是因為,? 用 UTF-8 編碼后變成了 0xEFBFBD(就是上面的字節(jié)數(shù)組 [-17, -65, -67]),兩個連起來就是 0xEFBFBDEFBFBD,也就是上面的字節(jié)數(shù)組[-17, -65, -67, -17, -65, -67]。

而 GBK 編碼依然采用雙字節(jié)編碼方案,因此上面的 6 字節(jié) 0xEFBFBDEFBFBD,就被拆成了 3 個 2 字節(jié)字符即 0xEFBF, 0xBDEF, 0xBFBD 對應 GBK 編碼里面就是:錕(0xEFBF),斤(0xBDEF),拷(0xBFBD)。

錕斤拷(可向右滑動)

現(xiàn)在,你知道了嗎?

留個作業(yè)題:開篇的五言絕句,你知道另外的梗是來自哪里嗎?


文章名稱:1分鐘帶你認識從"?"到"錕斤拷"
當前鏈接:http://www.dlmjj.cn/article/djspjih.html