首页 > 技术文章 > Python 入门 之 编码

caiyongliang 2019-08-18 16:30 原文

1、编码初识

(1)ASCII码 :256 个 英文1个字节,不支持中文

(2)GBK(国标码) : 英文1个字节 中文两个字节

(3)unicode (万国码):英文4个字节 中文4个字节

(4)Utf-8 :最流行的编码集(密码本) 英文1个字节;欧洲2个字节;亚洲3个字节

​ Win – 编码gbk linux – 编码utf-8 mac – 编码utf-8

2、编码进阶

(1)编码:

<1> ASCII码:

​ 支持:英文,数字,符号 1字节

​ 不支持:中文

<2> GBK(国标):

​ 支持:英文,数字,符号 --- ASCII 1字节

​ 支持:中文 2字节

<3> Unicode(万国码):

​ 支持:英文,数字,符号 ---ASSCII 4字节

​ 支持:欧洲 4字节

​ 支持:亚洲 4字节

<4> Utf – 8:

​ 支持:英文,数字,符号 --- ASSCII 1字节

​ 支持:欧洲 2字节

​ 支持:亚洲 3字节

<5> 字节名.encode(“utf-8”) # 编码

s = "今天"      
s1 = s.encode("utf-8")    # 编码
print(s1)                 # b'\xe4\xbb\x8a\xe5\xa4\xa9'

<6> 字节名.decode(“utf-8”) # 解码

s = "今天" 
s1 = s.encode("utf-8")     # 编码
s2 = s1.decode("utf-8")    # 解码
print(s2)                  # '今天'

# 用什么编码就要用什么解码

Python3:默认编码 unicode
Python2:默认编码 ASCII Python2不支持中文

3、单位转换

1字节 == 8位 (10101001)

字节:存储和传输, 网络传输一定是字节

1字节 == 8位 ( 1Bytes == 8bit )

1B == 8b
1KB == 1024 B
1MB == 1024 KB
1GB ==1024 MB
1TB ==1024 GB
1PB ==1024 TB
1EB ==1024 PB

推荐阅读