首页 > 其他 > 详细

[操作系统]字符|编码

时间:2020-07-19 17:20:38      阅读:47      评论:0      收藏:0      [点我收藏+]

1 概念

1.1 字符 Character

各种【文字】和【符号】的总称,包括:各国文字、标点符号、图形符号、数字等

1.2 字符集 Character Set

  • 多个【字符的集合】,字符集种类较多,每个字符集包含的字符、字符个数均不同。
  • 常见的字符集名称:ASCII字符集、Big5(中文最早的编码表/字符集)、GB2312字符集、GBK字符集、GB18030字符集、Unicode字符集(万国码)
  • 计算机要准确地处理各种字符集文字,需进行字符集【编码】,以便计算机能够【识别、存储】各种文字。

1.3 字符编码/字集码 Character Encoding

字符编码,也称【字集码】;把字符集中的字符,【编码】为指定集合中的某一对象,以便文本在计算机中【存储】和通过【网络通信】进行传递。
例如:

  • Unicode字符集可根据需要,以UTF-8、UTF-16、UTF-32等方法编码;
  • GB2312可使用ISO/IEC2022、EUC等标准编码
  • 而BIG-5这类字符集通常不需要编码,即可使用。即 BIG-5既是字符集,又是字符编码。

1.3.1 ASCII码

ASCII码(America Standard Code for Information Interchange),即 美国信息交换标准码。
它已被国际标准化组织(ISO)定为国际标准,称为 ISO 646标准。
适用于所有拉丁文字母。

ASCII码是单字节编码,使用指定的7位或把8位二进制数组合起来表示128或256个字符。

技术分享图片

1.3.2 GBK编码

GBK编码是汉字编码标准之一,全称《汉字内码扩展规范》,由中华人民共和国全国信息技术标准化技术委员会于1995年12月1日制订,由国家技术监督局标准化司、电子工业部科技与质量监督司于1995年12月15日以技监标函1995 229号文件的形式,将它确定为技术规范指导性文件。
GBK即“国标”、“扩展”汉语拼音的首字母,英文名: Chinese Internal Code Specification。
GBK编码兼容GB2312,中文Windows的默认/缺省内码就是GBK编码。

[操作系统]字符|编码

原文:https://www.cnblogs.com/johnnyzen/p/13339584.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!