首页 > 其他 > 详细

预习非数值数据的编码方式

时间:2020-09-20 20:22:32      阅读:36      评论:0      收藏:0      [点我收藏+]

非数值数据的编码表示

1.逻辑值,字符等数据都是非数值数据,在机器颞部他们也用二进制表示.
2.逻辑值:逻辑数据和数值数据都是一串0/1序列,形式没有差异,逻辑数据通过逻辑运算指令处理,数值数据通过算术运算指令处理。
3.西文字符:西文由拉丁字母、数字、标点符号以及一些特殊符号组成,他们统称为字符。数字化编码,字符集中每一个字符都有一个代码(即二进制编码的0/1序列),构成了该字符集的代码表,简称码表。码表中的代码具有唯一性。
字符主要用于外部设备和计算机之间交换信息。一旦确定了所使用的字符集和编码方法后,计算机内部所表示的二进制代码和外部设备输入,打印和显示的字符之间就有唯一的对应关系。
4.汉字字符:
(1)汉字的输入码:由于汉字字数多,无法使每个汉字与西文键盘上的一个键相对应,因此必须使每个汉字用一个或几个键来表示,这种对每个汉字用相应的按键进行的编码表示就称为汉字的输人码,又称外码。因此汉字的输人码的码元(即组成编码的基本元素)是西文键盘中的某个按键。
(2)字符集与汉字内码:汉字被输人到计算机内部后,就按照一种称为内码的编码形式在系统中进行存储、查找,传送等处理。对于西文字符,它的内码就是ASCII码。对于汉字内码的选择,必须考虑以下几个因素:
(1)不能有二义性,即不能和 ASCII 码有相同的编码。
(2)要与汉字在字库中的位置有关系,以便于汉字的处理、查找。
(3)编码应尽量短。

数据的宽度和存储

1.数据的宽度和单位

1.1比特是计算机中处理、存储传输信息的最少单位
1.2在计算机内部,二进制信息的计量单位是字节,也称位组。一个字节等于8个比特
1.3字长通常是指CPU内部用于整数运算的数据通路的宽度
1.4字用来表示被处理信息的单位,用来度量各种数据类型的宽度

2,数据的存储和排列顺序

2.1多字节数据存放在连续的字节序列中,各字节在连续字节系列中的排列顺序不同,有两种排列方式:大端和小端
2.2大端方式将数据的最高有效字节MSB存放在低地址单元中,将最低有效字节LSB存放在高地址单元中,小端与之相反

数据效验码

1.奇偶效验码

在奇偶校验码中,两个数据有奇数位不同,则校验码不同,若偶数位不同,校验码相同,但至少有两个数据位不同,所以任意两个码字之间至少有两位不同,码距d=2
根据码距和检错能力关系可知,奇偶校验码只能检测奇数位错,不能发现偶数位出错,也不能确定出错位置,所以不具有纠错能力,因为所用的开销小,奇偶效验码常用于存储器读写检查或按字节传输过程中的数据效验

2.海明效验码

2.1它不仅具有检测错误的能力,同时还具有给出错误所在准确位置的能力 但是因为这种海明校验的方法只能检测和纠正一位出错的情况。所以如果有多个错误,就不能查出了。  假设为k个数据位设置r个校验位,则校验位能表示2^r个状态,可用其中的一个状态指出 "没有发生错误",用其余的2 ^r -1个状态指出有错误发生在某一位,包括k个数据位和r个校验位,因此校验位的位数应满足如下关系:
2^r ≥ k + r + 1 (2.7)
如要能检出与自动校正一位错,并能同时发现哪位错,此时校验位的位数r和数据位的位数k应满足下述关系:
2^r-1 ≥ k + r (2.8)

3.循环冗余效验码

3.1循环冗余码效验简称CRS码,是一种具有较强检错、纠错能力的效验码,常用于外存储器的数据效验,通过某种数学运算在数据和效验位之间建立约定关系。

预习非数值数据的编码方式

原文:https://www.cnblogs.com/wang15538715518-/p/13701195.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!