字符编码知识汇总

Bit(位),又名比特,是计算机中最小的存储单位。

由于计算机内部都是以二进制存储的,所以1个位只能存储0或者1,也就是只能存储两种状态。

如果我们规定用二进制0表示“是”,用二进制1表示“否”,那么就定义了“是否”这两个字符的编码,也就是字符的编码就是字符的二进制表示形式。在同样的编码规则下,不同的字符的二进制表示形式是唯一的,不会重复的。

由于在内存中一般以字节作为存储单位。 8个位组合起来变成了1个字节,比如0 1 0 1 1 0 1 0。

1个位可以存储0或者1两种模式,2个位可以存储00 01 10 11四种模式,依次类推,8个位可以存储2的8次方种模式,也就是256个模式。如果用1个字节来编码的话,总共可以对256个字符进行编码,因为有256种不同的二进制形式。

类似地,如果是用两个字节来编码的话,总共可以对65536个字符进行编码,因为有65536种不同的二进制形式。

比如一种编码规则规定二进制形式“00010000 00000001”可以表示字符“我”,另一种编码规则规定相同的二进制形式“00010000 00000001”可以表示字符“他”,这样就形成了多种不同的编码。

当然,这些编码规则一定是要事先约定的,不然计算机将无法正确的显示字符,也就是如果不事先规定二进制形式“00010000 00000001”用来表示字符“他”还是字符“我”的话,那么在打开文件时,字符将无法显示,因为内容都是以二进制形式存储的。

为了便于信息的沟通,国际上先后推出了各种编码规则,比较有名的有ASCII编码、ANSI编码、UNICODE编码等。

ASCII编码规定用7位二进制位表示128个字符,如下表所示

Bin(二进制) Dec(十进制) Hex(十六进制) 缩写/字符 解释
0000000 0 0 NUL(null) 空字符
0000001 1 1 SOH(start of headline) 标题开始
0000010 2 2 STX (start of text) 正文开始
0000011 3 3 ETX (end of text) 正文结束
0000100 4 4 EOT (end of transmission) 传输结束
0000101 5 5 ENQ (enquiry) 请求
0000110 6 6 ACK (acknowledge) 收到通知
0000111 7 7 BEL (bell) 响铃
0001000 8 8 BS (backspace) 退格
0001001 9 9 HT (horizontal tab) 水平制表符
0001010 10 0A LF (NL line feed, new line) 换行键
0001011 11 0B VT (vertical tab) 垂直制表符
0001100 12 0C FF (NP form feed, new page) 换页键
0001101 13 0D CR (carriage return) 回车键
0001110 14 0E SO (shift out) 不用切换
0001111 15 0F SI (shift in) 启用切换
0010000 16 10 DLE (data link escape) 数据链路转义
0010001 17 11 DC1 (device control 1) 设备控制1
0010010 18 12 DC2 (device control 2) 设备控制2
0010011 19 13 DC3 (device control 3) 设备控制3
0010100 20 14 DC4 (device control 4) 设备控制4
0010101 21 15 NAK (negative acknowledge) 拒绝接收
0010110 22 16 SYN (synchronous idle) 同步空闲
0010111 23 17 ETB (end of trans. block) 结束传输块
0011000 24 18 CAN (cancel) 取消
0011001 25 19 EM (end of medium) 媒介结束
0011010 26 1A SUB (substitute) 代替
0011011 27 1B ESC (escape) 换码(溢出)
0011100 28 1C FS (file separator) 文件分隔符
0011101 29 1D GS (group separator) 分组符
0011110 30 1E RS (record separator) 记录分隔符
0011111 31 1F US (unit separator) 单元分隔符
0100000 32 20 (space) 空格
0100001 33 21 ! 叹号
0100010 34 22 双引号
0100011 35 23 # 井号
0100100 36 24 $ 美元符
0100101 37 25 % 百分号
0100110 38 26 & 和号
0100111 39 27 闭单引号
0101000 40 28 ( 开括号
0101001 41 29 ) 闭括号
0101010 42 2A * 星号
0101011 43 2B + 加号
0101100 44 2C , 逗号
0101101 45 2D 减号/破折号
0101110 46 2E . 句号
0101111 47 2F / 斜杠
0110000 48 30 0 数字0
0110001 49 31 1 数字1
0110010 50 32 2 数字2
0110011 51 33 3 数字3
0110100 52 34 4 数字4
0110101 53 35 5 数字5
0110110 54 36 6 数字6
0110111 55 37 7 数字7
0111000 56 38 8 数字8
0111001 57 39 9 数字9
0111010 58 3A : 冒号
0111011 59 3B ; 分号
0111100 60 3C < 小于
0111101 61 3D = 等号
0111110 62 3E > 大于
0111111 63 3F ? 问号
1000000 64 40 @ 电子邮件符号
1000001 65 41 A 大写字母A
1000010 66 42 B 大写字母B
1000011 67 43 C 大写字母C
1000100 68 44 D 大写字母D
1000101 69 45 E 大写字母E
1000110 70 46 F 大写字母F
1000111 71 47 G 大写字母G
1001000 72 48 H 大写字母H
1001001 73 49 I 大写字母I
1001010 74 4A J 大写字母J
1001011 75 4B K 大写字母K
1001100 76 4C L 大写字母L
1001101 77 4D M 大写字母M
1001110 78 4E N 大写字母N
1001111 79 4F O 大写字母O
1010000 80 50 P 大写字母P
1010001 81 51 Q 大写字母Q
1010010 82 52 R 大写字母R
1010011 83 53 S 大写字母S
1010100 84 54 T 大写字母T
1010101 85 55 U 大写字母U
1010110 86 56 V 大写字母V
1010111 87 57 W 大写字母W
1011000 88 58 X 大写字母X
1011001 89 59 Y 大写字母Y
1011010 90 5A Z 大写字母Z
1011011 91 5B [ 开方括号
1011100 92 5C \ 反斜杠
1011101 93 5D ] 闭方括号
1011110 94 5E ^ 脱字符
1011111 95 5F _ 下划线
1100000 96 60 ` 开单引号
1100001 97 61 a 小写字母a
1100010 98 62 b 小写字母b
1100011 99 63 c 小写字母c
1100100 100 64 d 小写字母d
1100101 101 65 e 小写字母e
1100110 102 66 f 小写字母f
1100111 103 67 g 小写字母g
1101000 104 68 h 小写字母h
1101001 105 69 i 小写字母i
1101010 106 6A j 小写字母j
1101011 107 6B k 小写字母k
1101100 108 6C l 小写字母l
1101101 109 6D m 小写字母m
1101110 110 6E n 小写字母n
1101111 111 6F o 小写字母o
1110000 112 70 p 小写字母p
1110001 113 71 q 小写字母q
1110010 114 72 r 小写字母r
1110011 115 73 s 小写字母s
1110100 116 74 t 小写字母t
1110101 117 75 u 小写字母u
1110110 118 76 v 小写字母v
1110111 119 77 w 小写字母w
1111000 120 78 x 小写字母x
1111001 121 79 y 小写字母y
1111010 122 7A z 小写字母z
1111011 123 7B { 开花括号
1111100 124 7C | 垂线
1111101 125 7D } 闭花括号
1111110 126 7E ~ 波浪号
1111111 127 7F DEL (delete) 删除

 

 

       

发表评论