02.字符编码

时间：2019-04-29 11:08:56 阅读：134 评论：0 收藏：0 [点我收藏+]

一、计算机的系统分为三层：应用软件操作系统硬件二、软件执行的过程 1、文本编辑器读一个文件的三个过程 ⑴、先启动文本编辑器 ⑵、文本编辑器会将文件内容读入内存 ⑶、将读入内存的内容显示到屏幕上 2、cpython解释器执行一个python文件的三个过程： ⑴、先启动python解释器 ⑵、python解释器会将python文件的内容当中普通文本内容读入内存 ⑶、开始解释执行刚刚读入内存的代码，识别python语法三、字符编码字符编码指将字符编码成二进制数字(字节) 编码的过程一定要遵循一个标准，这个标准称为字符编码表字符-----编码----->二进制数字(字节)-----解码------>字符四、编码规则：内存中固定使用unicode编码(不可更改)，我们可以改变的是数据由内存存到硬盘时采用的编码（应该采用utf-8） 1、ASCII表：只能识别英文字符，用8bit(1Bytes)对应1个英文字符 2、GBK表：可识别中文、英文字符，用8bit(1Bytes)对应1个英文字符，用16bit(2Bytes)对应1个中文字符 1个英文字符：8bit(1Bytes) 1个中文字符：16bit(2Bytes) 3、unicode(内存中默认使用该编码):用2Bytes对应1个字符 1、可以识别万国字符 2、可以与各种字符编码的二进制数字都有对应关系 4、utf-8全称Unicode Transformation Format 1个英文字符：8bit(1Bytes) 1个中文字符：48bit(3Bytes) ***unicode二进制-----编码----->utf-8二进制-----解码----->unicode二进制五、解决乱码的核心问题 1、当初以什么编码存的，就应该以什么编码去读（解码） 2、保证运行Python程序的前两个阶段不乱码的解决方案：在文件首行添加文件头如#coding:utf8(utf8指存储时的字符编码）六、python解释器的编码 1、python解释器默认的编码 python3：默认utf-8 python2：默认ASCII 七、python对字符串的存储 python3的字符串类型在内存中存成unicode格式的二进制 python2的字符串类型在字符前加‘u‘内存中存成unicode格式的二进制八、打印字符编码 x = ‘上‘ res1 = x.encode(‘utf-8‘) res2 = x.encode(‘gbk‘) print(res1)--->b‘\xe4\xb8\x8a‘ print(res2)--->b‘\xc9\xcf‘ encode把字符编码为二进制数字，输出时为了方便阅读python解释器自动把二进制字符转为十六进制展示

02.字符编码

原文：https://www.cnblogs.com/nicolezhao/p/10789147.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)