GBK的文字編碼是雙字節(jié)來表示的,至于UTF-8編碼則是用以解決國際上字符的一種多字節(jié)編碼,正如標(biāo)題所言,下面為大家詳細(xì)介紹下到底是為什么呢。
能選擇的話還是應(yīng)該用UTF-8
事實(shí)上Windows系統(tǒng)自己的程序已經(jīng)全面轉(zhuǎn)向Unicode,而GBK只是為了應(yīng)付中國標(biāo)準(zhǔn)的權(quán)宜之計(jì)。
GBK的文字編碼是雙字節(jié)來表示的,即不論中、英文字符均使用雙字節(jié)來表示,只不過為區(qū)分中文,將其最高位都定成1。
至于UTF-8編碼則是用以解決國際上字符的一種多字節(jié)編碼,它對英文使用8位(即一個(gè)字節(jié)),中文使用24位(三個(gè)字節(jié))來編碼。對于英文字符較多的論壇則用UTF-8節(jié)省空間。
GBK包含全部中文字符,
UTF-8則包含全世界所有國家需要用到的字符。
GBK是在國家標(biāo)準(zhǔn)GB2312基礎(chǔ)上擴(kuò)容后兼容GB2312的標(biāo)準(zhǔn)(好像還不是國家標(biāo)準(zhǔn))
UTF-8編碼的文字可以在各國各種支持UTF8字符集的瀏覽器上顯示。
比如,如果是UTF8編碼,則在外國人的英文IE上也能顯示中文,而無需他們下載IE的中文語言支持包。
所以,對于英文比較多的論壇 ,使用GBK則每個(gè)字符占用2個(gè)字節(jié),而使用UTF-8英文卻只占一個(gè)字節(jié)。
請注意:UTF-8版本雖然具有良好的國際兼容性,但中文需要比GBK/BIG5版本多占用50%的數(shù)據(jù)庫存儲空間,因此并非推薦使用,僅供對國際兼容性有特殊要求的用戶使用。
簡單地說:
對于中文較多的論壇,適宜用GBK編碼節(jié)省數(shù)據(jù)庫空間。
對于英文較多的論壇,適宜用UTF-8節(jié)省數(shù)據(jù)庫空間。
gbk和gb2312的區(qū)別有哪些
首先大家要了解什么是gbk?什么是gb2312?我們要知道他們都是一種字符編碼,當(dāng)然字符編碼還有很多種。
而字符編碼我們可以這樣理解:
在計(jì)算機(jī)中存放的都是0和1的二進(jìn)制值。
8個(gè)位對應(yīng)一個(gè)字節(jié),常用16進(jìn)制來表示。
那么我們?nèi)绻胍谟?jì)算機(jī)上看到我們想要的字符顯示,而不是各種0和1的數(shù)字該怎么實(shí)現(xiàn)呢?
這里我們就需要使計(jì)算機(jī)把其所存儲的對應(yīng)的16進(jìn)制的數(shù)值,轉(zhuǎn)化為對應(yīng)的字符,包括英文和中文等其他語言的字符,然后輸出到屏幕上。
所以編碼也就是,定義了一套規(guī)則,去指定哪些數(shù)值,對應(yīng)著哪些字符。
那么字符編碼,就是定義了一套規(guī)則,指定了計(jì)算機(jī)中存放的這么多值中的哪個(gè)值,對應(yīng)了電腦屏幕顯示出來的哪個(gè)字母。
綜上所述,大家應(yīng)該都能理解GBK和GB2312是一種字符編碼了吧。
下面我們再具體說說他們的區(qū)別與相同點(diǎn):
相同點(diǎn):
1、GBK和GB2312 都是16位的!
2、它們通常用在網(wǎng)頁的meta標(biāo)簽內(nèi)。
不同點(diǎn):
1、GBK字符編碼支持簡體中文和繁體中文!
GBK全稱《漢字內(nèi)碼擴(kuò)展規(guī)范》(GBK即“國標(biāo)”、“擴(kuò)展”漢語拼音的第一個(gè)字母,英文名稱:Chinese Internal Code Specification) ,中華人民共和國全國信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會1995年12月1日制訂,國家技術(shù)監(jiān)督局標(biāo)準(zhǔn)化司、電子工業(yè)部科技與質(zhì)量監(jiān)督司1995年12月15日聯(lián)合以技監(jiān)標(biāo)函1995 229號文件的形式,將它確定為技術(shù)規(guī)范指導(dǎo)性文件。
2、GB2312只支持簡體中文!
《信息交換用漢字編碼字符集》是由中國國家標(biāo)準(zhǔn)總局1980年發(fā)布,1981年5月1日開始實(shí)施的一套國家標(biāo)準(zhǔn),標(biāo)準(zhǔn)號是GB 2312—1980。
GB 2312標(biāo)準(zhǔn)共收錄6763個(gè)漢字,其中一級漢字3755個(gè),二級漢字3008個(gè);同時(shí),GB 2312收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄語西里爾字母在內(nèi)的682個(gè)全角字符。
如果你的網(wǎng)頁主要面對使用漢語的中國人的話,使用 GB2312和GBK非常好,文字儲存體積要小,有一些優(yōu)點(diǎn)。如果你的網(wǎng)頁要面向世界的話,你再用GB2312和GBK作為網(wǎng)頁編碼的話,有些電腦上的瀏覽器沒有這種編碼,你的網(wǎng)頁漢字內(nèi)容就會變成無法識別的亂碼。
文章轉(zhuǎn)自腳本之家,原文鏈接:https://www.jb51.net/web/93434.html
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!