1. ASCII码

  1. 上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定。这被称为ASCII码,一直沿用至今。
  2. ASCII码一共规定了128个字符的编码,只占用了一个字节的后七位,最前面的1为统一规定为0。(提示:一个字节可以表示256个字符,ASCII码只用128个字符)。
  3. 缺点:不能表示所有字符。

2. Unicode编码

  1. 优点:Unicode将世界上所有的符号都纳入其中,每一个符号都给予了独一无二的编码,使用Unicode不会有乱码的问题。
  2. 缺点:一个英文字母和汉字都占用两个字节,比较浪费存储空间。
  3. 编码0 - 127的字符和ASCII的编码一样。比如字符a在ASCII码中是0x61,在Unicode编码中是0x0061,都对应97,所以Unicode编码兼容ASCII编码

3. UTF-8编码

互联网的普及,强烈要求出现一种统一的编码方式。UTF-8就是在互联网上使用最广的一种unicode的实现方式

  1. UTF-8最大的一个特点,就是它是一种变长的编码方式。它可以使用1~6个字节表示一个符号,根据不同的符号而变化字节长度。
  2. 使用大小可变的编码,字母占1个字节,汉字占3个字节。