首页 > 其他 > 详细

3 -11 字符编码与转换

时间:2018-03-11 19:57:35      阅读:296      评论:0      收藏:0      [点我收藏+]

中文的字符编码  是 gbk   windows 默认的字符编码也是gbk

每个国家都有自己的字符编码 为了 统一 就有了

unicode

##unicode 不管英文中文都占 2个字节  16位

ascii码 一个英文一个字节  不能存中文。。 8 位 英文 或特殊字符

转换后 中文 变成3个字节

其中utf-8 是  Unicode的 可变长度的扩展级

技术分享图片

 encode 是编码    decode  是 解码   

 

import sys
print(sys.getdefaultencoding())
### 查看系统编码是 什么

 

 

技术分享图片

 

utf-8 转换成  gbk

1,首先你要去Unicode 里告诉 它  我是 utf-8    decode()解压

2  然后再编码成 gbk 格式 显示

gbk 转换 utf-8

1,首先去unicode 里告诉自己是 gbk       decode(‘gbk‘)

2 , 然后再编码成 utf-8  展现       encode(‘utf-8‘)

以上 Python2.x   操作。

 

3 -11 字符编码与转换

原文:https://www.cnblogs.com/th-lyc/p/8545366.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!