1. ASCII码
- 上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定。这被称为
ASCII码
,一直沿用至今。 - ASCII码一共规定了128个字符的编码,只占用了一个字节的后七位,最前面的1为统一规定为0。(提示:一个字节可以表示256个字符,ASCII码只用128个字符)。
- 缺点:不能表示所有字符。
2. Unicode编码
- 优点:Unicode将世界上所有的符号都纳入其中,每一个符号都给予了独一无二的编码,使用Unicode不会有乱码的问题。
- 缺点:一个英文字母和汉字都占用
两个字节
,比较浪费存储空间。 - 编码0 - 127的字符和ASCII的编码一样。比如字符
a
在ASCII码中是0x61
,在Unicode编码中是0x0061
,都对应97,所以Unicode编码兼容ASCII编码
。
3. UTF-8编码
互联网的普及,强烈要求出现一种统一的编码方式。UTF-8就是在互联网上使用最广的一种unicode的实现方式
。
- UTF-8最大的一个特点,就是它是一种变长的编码方式。它可以使用1~6个字节表示一个符号,根据不同的符号而变化字节长度。
- 使用
大小可变的编码
,字母占1个字节,汉字占3个字节。