发布网友 发布时间:2022-04-23 07:41
共1个回答
热心网友 时间:2022-06-17 20:34
两个字节是不能显示所有汉字的。GBK编码的汉字每个字占两个字节,总共收录了2万多的汉字。
GBK、UTF-8等编码是用来存储和传送的,并不是计算机内部使用的编码。实际上,计算机内部使用的是unicode编码。为什么不将unicode作为存储的编码?答案是,unicode编码位数较多,会造成存储空间和网络带宽的浪费。unicode内码和GBK、utf8呈映射关系。unicode编码可以转化为3-4个字节的UTF-8编码。GBK中可以表示的汉字比较少,但对于常用字来说已经够了。
Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。Unicode用数字0-0x10FFFF来映射这些字符,最多可以容纳1114112个字符,或者说有1114112个码位。码位就是可以分配给字符的数字。