点击查看:2015计算机二级考试《Office高级应用》汇总
第2章 信息的表示与存储
2.1数据与信息
数据是由人工或自动化手段加以处理的事实、场景、概念和指示的符号表示。字符、声音、表格、符号和图像等都是不同形式的数据。
数据与信息的区别:信息是客观事物属性的反映,是经过加工处理并对人类客观行为产生影响的数据表现形式;数据则是反应客观事物属性的记录,是信息的具体表现形式。任何事物的属性都是通过数据来表示的,数据经过加工处理后成为信息,而信息必须通过数据才能传播,才能对人类产生影响。
例如,数据2、4、6.8、10、12是一组数据,其本身是没有意义的,但对它进行分析后,就可得到一组等差数列,从而很清晰的得到后面的数字。这便对这组数据赋予了意义,称为信息,是有用的数据。
2.2计算机中数据的单位
计算机内所有的信息均以二进制的形式表示,数据的最小单位是位,存储容量的基本单位是字节。
1.计算机中数据的常用单位
位是度量数据的最小单位,代码只有0和1,采用多个数码表示一个数,其中每一个数码称为1位(bit)。
字节是信息组织和存储的基本单位,一个字节由8位二进制数字组成。字节也是计算机体系结构的基本单位。为了便于平衡存储器的大小,统一以字节(Byte,B)为单位。常见的存储单位如表2—1所示。
表2—1常见的存储单位
单位 | 名称 | 含义 | 说明 |
KB | 千字节 | 1KB=1024B=210B | 适用于文件计量 |
MB | 兆字节 | 1MB=1024KB=220B | 适用于内存、软盘、光盘计量 |
GB | 吉字节 | 1GB=1024MB=230B | 适用于硬盘计量 |
TB | 太字节 | 1TB=1024GB=240B | 适用于硬盘计量 |
2.字长
随着电子技术的发展,计算机的并行能力越来越强,人们通常将计算机一次能够并行处理的二进制数的位数称为字长,也称为计算机的一个“字”。字长是计算机的一个重要指标,直接反映一台计算机的计算能力和精度,字长越长,说明计算机的数据处理速度越快。计算机的字长通常是字节的整倍数,如8位、16位、32位,发展到今天,微型机已达到64位,大型机已达128位。
3.计算机数据类型
计算机使用的数据可以分为数值数据和字符数据(非数值数据)。在计算机中,不仅数值数据用二进制数来表示,字符数据也用二进制数来进行编码。
2.3字符的编码
字符包括西文字符(字母、数字、各种符号)和中文字符,即所有不可做算术运算的数据。
计算机以二进制数的形式存储和处理数据,因此,字符必须按特定的规则进行二进制编码才可进入计算机。
1.西文字符的编码
用以表示字符的二进制编码称为字符编码。计算机中常用的字符(西文字符)编码有两种:EBCDIC码和ASCⅡ码。
ASCⅡ码是美国信息交换标准代码(American Standard Code forInformafion Interchange)的缩写,被国际标准化组织指定为国际标准,它有7位码和8位码两种版本。
微型计算机采用的是ASCⅡ码,而国际通用的则是7位ASCⅡ码,即用7位二进制数来表示一个字符的编码,共有27=128个不同的编码值,相应可以表示l28个不同字符的编码。2.汉字的编码
我国于1980年发布了国家汉字编码标准GB2312—1980,全称是《信息交换用汉字编码字符集一基本集》,简称GB码或国标码。国标码的字符集:共收录了7445个图形符号和两级常用汉字等。
区位码:也称为国际区位码,是国标码的一种变形,是由区号(行号)和位号(列号)构成,区位码由4位十进制数字组成,前2位为区号,后2位为位号。
·区:阵中的每一行,用区号表示,区号范围是1~94。
·位:阵中的每一列,用位号表示,位号范围也是1~94。
·区位码:汉字的区号与位号的组合(高两位是区号,低两位是位号)。
实际上,区位码也是一种汉字输入码,其最大优点是一字一码即无重码,最大缺点是难以记忆。
3.汉字的处理过程
从汉字编码的角度看,计算机对汉字信息的处理过程实际上是各种汉字编码间的转换过程,这些编码主要包括:汉字输入码、汉字内码、汉字地址码、汉字字形码等。
(1)汉字输入码
汉字输入码是为使用户能够使用西文键盘输入汉字而编制的编码,也叫外码。好的输入编码应具有编码短,可以减少击键的次数;重码少,可以实现盲打,便于学习和掌握,但目前还没有一种符合上述全部要求的汉字输人编码方法。
汉字输入码有许多种不同的编码方案,大致分为4类:音码、音形码、形码、数字码。
(2)汉字内码
汉字内码是为在计算机内部对汉字进行处理、存储和传输而编制的汉字编码。它应能满足存储、处理和传输的要求,不论用何种输入码,输入的汉字在机器内部都要转换成统一的汉字机内码,然后才能在机器内传输、处理。
在计算机内部为了能够区分是汉字还是ASCⅡ码,将国标码每个字节的最高位由0变为1(即汉字内码的每个字节都大于128)。汉字的国标码与其内码存在下列关系是:内码=汉字的国标码+8080H。
(3)汉字字形码
汉字字形码是存放汉字字形信息的编码,它与汉字内码一一对应。每个汉字的字形码是预先存放在计算机内的,常称为汉字库。
描述汉字字形的方法主要有点阵字形和矢量表示方式。点阵字形法:用一个排列成方阵的点的黑自来描述汉字。矢量表示方式:描述汉字字形的轮廓特征,采用数学方法描述汉字的轮廓曲线。
(4)汉字地址码
汉字地址码是指汉字库(这里主要指汉字字形的点阵式字模库)中存储汉字字形信息的逻辑地址码。
在汉字库中,字形信息都是按一定顺序(大多数按照标准汉字国标码中汉字的排列顺序)连续存放在存储介质中的,所以汉字地址码也大多是连续有序的,而且与汉字机内码间有着简单的对应关系,从而简化了汉字内码到汉字地址码的转换。
4.各种汉字编码之间的关系
汉字的输入、输出和处理的过程,实际上是汉字的各种代码之间的转换过程。汉字通过汉字输人码输人到计算机内。然后通过输入字典转换为内码,以内码的形式进行存储和处理。在汉字通信过程中。处理机将汉字内码转换为适合于通信用的交换码,以实现通信处理。
点击查看:
北京 | 天津 | 上海 | 江苏 | 山东 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
广东 | 河北 | 湖南 | 广西 | 河南 |
海南 | 湖北 | 四川 | 重庆 | 云南 |
贵州 | 西藏 | 新疆 | 陕西 | 山西 |
宁夏 | 甘肃 | 青海 | 辽宁 | 吉林 |
黑龙江 | 内蒙古 |