当前位置:软件学堂 > 资讯首页 > 软件教程 > 办公软件 > UTF-8是什么?UTF-8和GBK的区别

UTF-8是什么?UTF-8和GBK的区别

2013/6/6 17:30:55作者:佚名来源:网络

移动端

今天学无忧打开自己的网站查看源文件代码发现上面有一句charset=UTF-8的代码,后来才知道这个UTF-8是一种编码。但是学无忧又看了别人的网站源文件代码显示的是GBK(GB2312)编码,那UTF-8是什么?UTF-8和GBK的区别在哪里?这里给大家详细说明UTF-8和GBK的不同之处。

UTF-8是UNICODE的一种变长字符编码又称万国码,UTF-8用1到6个字节编码UNICODE字符。用在网页上可以同一页面显示中文简体繁体及其它语言。UTF-8的有点就是可以通过屏蔽位和移动操作进行快速读写,字符串比较时strcmp()和wcscmp()的返回结果相同,因此使排序变得更加容易。

GBK编码,是在GB2312-80标准基础上的内码扩展规范,使用了双字节编码方案。向上支持 ISO 10646.1 国际标准,是前者向后者过渡过程中的一个承上启下的标准。下面来对比这两种编码的区别?

一、编码方式不同

UTF-8编码采用的是一种多字节编码,在英文中8位代表一个字节,而中文字是24位代表一个字节。而GBK编码方式都是通过双字节来表达,不管文字是英文还是中文字符都是一概而论,当然在区分中文的时候,会定位最高位为1。

二、UIF-8及GBK的兼容性

这两种编码都是系统的字符编码,GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准,UTF-8编码的文字可以在各国各种支持UTF8字符集的浏览器上显示。也就是说如果你的网站使用的是UTF-8编码,在国外观看你的网站浏览器上就会帮你切换到中文状态,而使用GBK编码的话,在国外浏览网页就必须要下载中文语言支持包,如果没有下载就会出现乱码的现象。

三、UIF-8好还是GBK编码好?

UTF-8在英文站点中所占用的字节是1个字节,而GBK编码所占用的是2个字节,这样如果是在英文网站或者你的网站英文字符过多的话,建议使用UTF-8编码,这样能节省一些空间。

对于中文比较多的论坛 ,使用GBK则每个字符占用2个字节,而使用UTF-8中文却只占3个字节。可以采用GBK版本,但是UIF-8在所以浏览器都能正常显示,而GBK可能有些浏览器会有不兼容的现象,所以根据实际情况来衡量网站到底使用哪种编码。

标签: 代码  网页