您的位置 首页 > 数码极客

【计算机最小的存储单位】学C语言的看过来,最完整进制转换、整数和小数内存存储模型

什么是真法

小数是舍入系数制,是具有人为定义的舍入的计数方法。

对于任何一种进制---N进制,就表示每一位置上的数运算时都是逢N进一位。

数数相信大家都会了,比如0 1 2 3 4 5 6 7 8 9 10 11 12 13...,在数数时某一位数量满10了就向前进位,这种逢十进一的进位制,就叫十进制。

不过在日常生活中,并不止这一种进位制,比如1小时有60分钟,1分钟有60秒,满60进一,这就是六十进制。

而在计算机中常用的进制除了十进制,还有二进制、八进制、十六进制

如果足下正在学习C语言,可以关注小编专栏视频教程,由浅入深,轻松上手。

二进制

组成:0 1

规则:逢二进一

表示方式:二进制数1000010可写成(1000010)2或写成1000010B

八进制

组成:0 1 2 3 4 5 6 7

规则:逢八进一

表示方式:八进制数520可写成(520)8或写成520O

十六进制

组成:0 1 2 3 4 5 6 7 8 9 A B C D E F

规则:逢十六进一

表示方式:十六进制的520可以写成(520)16或写成520H

为什么在计算机中,有这么多种进制表示方式?

  • 方便:二进制数中只有两个数码0和1,可用具有两个不同稳定状态的元器件来表示一位数码。
  • 简单:二进制数运算简单,大大简化了计算中运算部件的结构,0+0=0,0+1=1,1+0=1,1+1=10。
  • 真假:二进制天然兼容逻辑运算。
  • 缺点:二进制计数在日常使用上有个不便之处,就是位数往往很长,读写不便,如:把十进制的100000D写成二进制就是11000011010100000B,所以计算机领域我们实际采用的是十六进制。二进制数转换为十六进制数时,长度缩减为原先的约四分之一,把十进制的100000写成八进制就是303240。十六进制的一个数位可代表二进制的四个数位。这样,十进制的100000写成十六进制就是186A0。

存储单位

我们平常使用的程序,如:Windows操作系统、打字软件、游戏软件等。一般安装在硬盘等外存上,但仅此是不能使用其功能,必须把它们调入内存中运行,才能真正使用其功能。

因为内存的读写速度相对于外存来说非常快,但是内存是暂时存储程序以及数据的地方。当我们使用WPS处理文稿时,当你在键盘上敲入字符时,它被存入内存中。当你选择存盘时,内存中的数据才会被存入硬(磁)盘。

内存是由无数个晶体管组成的(可以理解为灯泡),一个晶体管作为一比特(bit)的存储器。每个晶体管可以存储一个二进制0或1,比特通常也叫做位。


位(bit): 计算机存储的最小单位

字节(byte): 数据表示的最小单位

  • 一个字节通常8位长 1byte = 8 bit

千字节(KB):

  • 1KB = 1024byte
  • 为什么是1024,而不是1000呢?二的十次方刚好是1024,就这么表示啦~

字节以上的转换单位都是1024,只有一个字节等于八个位是不一样的...


思考:为什么硬盘标注的容量与实际的容量不一样?

买的256G硬盘实际上只有238.4G,咱们一起来换算一下:

硬盘厂商十进制计算:256G = 256,000MB = 256,000,000KB = 256,000,000,000Byte 以1000为单位换算操作系统二进制计算: 256G = 262,144MB = 268,435,456KB = 274,877,906,944Byte 以1024为单位换算那么256G实际容量:256,000,000,000Byte/1024MB/1024MB/1024MB = 238.4G

所以,买256G硬盘实际上只有238.4G,而且容量越大差距也就越大了。

进制转换

十进制转其他进制:短除法

  • 以十进制数520为例,分别转换为二进制、八进制和十六进制,转换过程如下:

其他进制转十进制:位权相加

  • 就以上面的520D的二进制、八进制和十六进制为例
  • 首先,需要对其他进制从右往左依次开始编号,0 1 2 3 4 5 ...
  • 然后,把每一位的数通过这个公式【数值 * 基数^编号】计算,然后把结果相加,即得到转换结果

二进制10 0000 1000 转十进制

 98 7654 3210 编号  10 0000 1000 B  1*2^9 + 0 + 1*2^3 = 512 + 0 + 8 = 520 D

八进制1010 转十进制

 3210 编号  1010 O  1*8^3 + 0 +1*8^0  = 520 + 8 =520 D  

十六进制208 转十进制

 210 编号  208 H  2*16^2 + 0 + 8*16^0 = 2*256 + 8 = 520 H  


八进制、十六进制与二进制相互转换:拆位

八进制与二进制

  • 一个八进制数可以拆分为3个二进制数,3个二进制数可以合成一个八进制数
 //二进制转八进制  001 000 001 000 B  1   0   1   0   O        //八进制转二进制  1   3   1   4   5   2   0    O      001 011 001 100 101 010 000  B

十六进制与二进制

  • 一个八进制数可以拆分为4个二进制数,4个二进制数可以合成一个八进制数
 //二进制转十六进制  0010 0000 1000 B  2    0    8    H        //十六进制转二进制  1    3    1    4    5    2    0    H  0001 0011 0001 0100 0101 0010 0000 B    

为什么可以这样拆位呢?

  • 三位二进制数表示的范围是[0 - 8) -> 2^3 对于八进制来说刚刚好
  • 四位二进制数表示的范围是[0 - 16) -> 2^4 对于十六进制来说刚刚好

整数的存储方式

一,机器数和机器数的真值

1,机器数

一个数在计算机中的二进制表示形式,叫做这个数的机器数。机器数是带符号的,在计算机用机器数的最高位存放符号,正数为0,负数为1。

比如,十进制中的数 +3 ,计算机字长为8位,转换成二进制就是0000 0011,如果是 -3 ,就是 100 00011 。

那么,这里的 0000 0011 和 1000 0011 就是机器数。

2,机器数的真值

因为第一位是符号位,所以机器数的形式值就不等于真正的数值。

例如上面的有符号数 1000 0011,其最高位1代表负,其真正数值是 -3,而不是形式值131(1000 0011转换成十进制等于131)。所以,为区别起见,将带符号位的机器数对应的真正数值称为机器数的真值。

例:0000 0001的真值 = +000 0001 = +1,1000 0001的真值 = –000 0001 = –1

二,原码, 反码, 补码

让我们先了解原码、反码和补码的概念。对于一个数,计算机要使用一定的编码方式进行存储,原码、反码、补码是机器存储一个具体数字的编码方式。

1,原码

原码就是机器数,即用第一位表示符号,其余位表示值。比如:如果是8位二进制:

[+1]原= 0000 0001

[-1]原= 1000 0001

第一位是符号位,因为第一位是符号位,所以8位二进制数的取值范围就是:(即第一位不表示值,只表示正负。)

[1111 1111 , 0111 1111] 即 [-127 , 127]

原码是人脑最容易理解和计算的表示方式。

2,反码

  • 正数的反码是其本身;
  • 负数的反码是在其原码的基础上,符号位不变,其余各个位取反。

[+1] = [0000 0001]原 = [0000 0001]反

[-1] = [1000 0001]原 = [1111 1110]反

可见如果一个反码表示的是负数,人脑无法直观地看出来它的数值。通常要将其转换成原码再计算。

3,补码

  • 正数的补码就是其本身;
  • 负数的补码是在其原码的基础上,符号位不变,其余各位取反,最后+1。(也即在反码的基础上+1)

[+1] = [0000 0001]原 = [0000 0001]反 = [0000 0001]补

[-1] = [1000 0001]原 = [1111 1110]反 = [1111 1111]补

对于负数,补码表示方式也是人脑无法直观看出其数值的。通常也需要转换成原码再计算其数值。

三,为何要使用原码、反码和补码

人脑可以知道第一位是符号位,在计算的时候我们会根据符号位,选择对真值区域的加减。(真值的概念在本文最开头) 但是对于计算机,加减乘数已经是最基础的运算,要设计得尽量简单,计算机辨别"符号位"显然会让计算机的基础电路设计变得十分复杂!

于是人们想出了将符号位也参与运算的方法。我们知道,根据运算法则减去一个正数等于加上一个负数,即:1-1 = 1 + (-1) = 0, 所以机器可以只有加法而没有减法,这样计算机运算的设计就更简单了。

我们以计算十进制表达式:1 - 1 = 0为例

首先来看原码:

1 - 1 = 1 + (-1) = [0000 0001]原+ [1000 0001]原= [1000 0010]原= -2

如果用原码表示,让符号位也参与计算,显然对于减法来说,结果是不正确的。这也就是为何计算机内部不使用原码表示一个数。

为了解决原码做减法的问题, 出现了反码:

1 - 1 = 1 + (-1) = [0000 0001]原+ [1000 0001]原= [0000 0001]反+ [1111 1110]反= [1111 1111]反= [1000 0000]原= -0

发现用反码计算减法,结果的真值部分是正确的。而唯一的问题其实就出现在"0"这个特殊的数值上,虽然人们理解上+0和-0是一样的,但是0带符号是没有任何意义的,而且会有[0000 0000]原和[1000 0000]原两个编码表示0。

于是补码的出现,解决了0的符号问题以及0的两个编码问题:

1-1 = 1 + (-1) = [0000 0001]原+ [1000 0001]原= [0000 0001]补+ [1111 1111]补= [1 0000 0000]补=[0000 0000]补=[0000 0000]原注意:进位1不在计算机字长里。

这样0用[0000 0000]表示,而以前出现问题的-0则不存在了。而且可以用[1000 0000]表示-128:-128的由来如下:

(-1) + (-127) = [1000 0001]原+ [1111 1111]原= [1111 1111]补+ [1000 0001]补= [1000 0000]补

-1-127的结果应该是-128,在用补码运算的结果中,[1000 0000]补就是-128,但是注意因为实际上是使用以前的-0的补码来表示-128,所以-128并没有原码和反码表示。(对-128的补码表示[1000 0000]补,算出来的原码是[0000 0000]元,这是不正确的)

使用补码,不仅仅修复了0的符号以及存在两个编码的问题,而且还能够多表示一个最低数。这就是为什么8位二进制,使用原码或反码表示的范围为[-127, +127],而使用补码表示的范围为[-128, 127]。

整数的存储是将十进制为的整数转换成其相应的补码后存储。

小数的存储方式

现如今的计算机中浮点数的存储都是遵循IEEE754/854标准,以二进制的科学计数法存放到内存中。

对于浮点数在计算机中有两种存储的精度,即单精度和双精度,单精度是32位,双精度是64位。

  • 符号S:0为正,1为负
  • 尾数M:小数点后面的部分
  • 指数E:即阶码,指明了小数点在数据中的位置
    • 为了让指数表示正、负引入了偏差码,float的为127,double的为1024

十进制小数转二进制小数

  • 先把整数部分转化为二进制
  • 再把小数部分转化为二进制(用2乘以小数部分,每次将结果整数取出,然后用剩余小数部分继续乘以2,直到小数部分为零,或者达到要求的精度为止)

以float f = 5.25为例

整数部分:5 -> 101

小数部分:0.25 -> 0.01

 0.25 * 2 = 0.5  --- 0  0.5  * 2 = 1.0  --- 1    从上往下取值:0.01    

最后结果:101.01 = 1.0101 * 2^2

可见指数实际值为2,加上偏差码127,2 + 127 = 129,129的二进制为10000001B,因此不难得到,8.25在内存中的存储情况为:

S

E

M

0

1000 0001

0101 0000 0000 0000 0000 000

如果把这个值作为整型使用,将是一个很大的数字,是1084751872


把这个内存里面的值转为十进制小数就很简单了:

 //1,首先判断S表示的正负     +  //2,计算出E实际表示的指数   1000 0001 = 129   129 - 127 = 2  //3,根据M写出二进制小数形式 1.0101 * 2^2 = 101.01  //4,对二进制小数以小数点为界限开始编号  210 -1-2 编号  101. 0 1 B  1*2^2 + 0 + 1*2^0 + 0*2^(-1) + 1*2^(-2) = 4 + 1 +  0.25 =5.25  

注意:

  • 在二进制,第一个有效数字必定是“1”,因此这个“1”并不会存储。
  • 浮点数不能精确表示其范围内的所有数。
  • 可精确表示的数不是均匀分布的,越靠近0越稠密。

关于作者: admin

无忧经验小编鲁达,内容侵删请Email至wohenlihai#qq.com(#改为@)

热门推荐