首页 > 其他 > 详细

第二模块 3.2 字符编码的转换

时间:2019-10-25 10:33:48      阅读:55      评论:0      收藏:0      [点我收藏+]

1 编码与解码

s.encode("utf-8")  编码以utf-8 编码成2进制

s.decode("utf-8)   以2进制解码成unicode

>>> s_utf8 = s.encode("utf-8")
>>> s_utf8
b\xe4\xbd\xa0\xe5\xa5\xbd\xe6\x9c\xaa\xe6\x9d\xa5
>>> s_utf8.decode("utf-8")
你好未来

技术分享图片

 

 2 编码的转换   

    把文字从一种编码转换成另外一种, 从gbk 转成utf-8

    为什么要进行编码的转换

    windows   gbk

           文件: gbk 文件

    linux/mac   utf-8

           文件: utf-8

    gbk ---> unicode-----> utf-8 

    unicode  : 万国码

                   跟所有的编码之间, 有映射关系

    

f = open("byte.txt", "rb")
s = f.read()
f.close()
s_unicode = s.decode("gbk")  # 转成 unicode
s_utf8 = s_unicode.encode("utf-8")
f = open("byte.txt",wb)
f.write(s_utf8)
f.close()

 

第二模块 3.2 字符编码的转换

原文:https://www.cnblogs.com/kissfire008/p/11736492.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!