字符編碼
一、ascii碼:
基于拉丁字母的一套電腦編碼系統(tǒng),主要用于顯示現(xiàn)代英語(yǔ)和其他西歐語(yǔ)言,最多只能用8位標(biāo)識(shí),即2**8=256-1,所以最多只能表示255個(gè)字符。
計(jì)算機(jī)沿用中國(guó),中文顯然遠(yuǎn)大于255字符,必須要對(duì)中文進(jìn)行編碼
二、中文編碼
為處理漢字,程序設(shè)計(jì)用于簡(jiǎn)體中文GB2132和繁體中文big5
GB2312(1980年) 共7445個(gè)字符,包括6763個(gè)漢字和682個(gè)其它符號(hào),
GBK1.0(1995年)收錄了21886個(gè)符號(hào),它分為漢字區(qū)和圖形符號(hào)區(qū)。漢字區(qū)包括21003個(gè)字符
GB18030(2000)取代GBK1.0證實(shí)成為國(guó)家標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)收錄了27484個(gè)漢字,同時(shí)還收錄了藏文、蒙文、維吾爾文等主要的少數(shù)民族文字。現(xiàn)在的PC平臺(tái)必須支持GB18030,對(duì)嵌入式產(chǎn)品暫不作要求。所以手機(jī)、MP3一般只支持GB2312。
總結(jié):1、從ASCII,GB2312,GBK到GB18030,編碼方法向下兼容。
2、中文版Windows的缺省內(nèi)碼還是GBK,可以通過(guò)GB18030升級(jí)包升級(jí)到GB18030
三、unicode碼
顯然ASCII碼無(wú)法將世界上的各種文字和符號(hào)全部表示,所以,就需要新出一種可以代表所有字符和符號(hào)的編碼,即:Unicode。它為每種語(yǔ)言中每個(gè)字符設(shè)定了統(tǒng)一并且唯一的二進(jìn)制編碼。最少2個(gè)字節(jié),可能更多
四、utf-8:
對(duì)Unicode編碼的壓縮和優(yōu)化,他不再使用最少使用2個(gè)字節(jié),而是將所有的字符和符號(hào)進(jìn)行分類:ascii碼中的內(nèi)容用1個(gè)字節(jié)保存、歐洲的字符用2個(gè)字節(jié)保存,東亞的字符用3個(gè)字節(jié)保存...
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫(xiě)作最大的動(dòng)力,如果您喜歡我的文章,感覺(jué)我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對(duì)您有幫助就好】元
