综述针对数据恢复研究的文件
来源:UC论文网2016-01-03 15:31
摘 要 :随着信息化技术的迅速发展,计算机在日常生活中的使用越来越普遍。但随之出现了各种问题,比如数据意外丢失、被损坏等现象非常普遍,这些情况都会给用户带来很多困扰
关键词:数据安全;信息安全;数据恢复
由于现代人对于计算机的安全性以及可靠性保护普遍缺乏了解,很容易造成数据丢失的现象。数据丢失的常见原因主要有以下几种。
1.1 计算机病毒
所谓计算机病毒,是指一种程序,一种被怀着恶意开发出的程序,它最大的特点就是破坏性和传染性。一旦计算机系统受到病毒的攻击,轻者会造成数据丢失,严重者甚至会造成系统崩溃。
1.2 误操作
很多数据丢失都是源于使用者的误操作,把原本不想删除的数据删除后又从回收站彻底删除,或在数据未保存的情况下将硬盘格式化。
1.3 操作系统(简称OS)或应用软件的错误
随着OS和某些应用软件代码量的增加,计算机死机或反应过慢等错误,都会给工作带来影响,造成不正常的数据丢失。
1.4 硬件失效
硬件失效的情况包括硬件损坏、电源不稳而自动重启等。它是数据丢失的最大原因之一,也往往是最严重的问题,有可能使数据恢复的可能性降低为0。
1.5 断电
计算机突然断电不仅仅会造成内存数据的丢失,甚者有可能造成磁盘数据的丢失、文件不同步、系统无法正常启动等问题。
1.6 内存溢出
造成内存溢出或者进程非法终止的原因很多,它就像突然断电一样,会造成当前的工作相关数据丢失等问题。
1.7 软件升级
软件升级有可能由于兼容性或稳定性问题造成之前的数据丢失。
2 数据读写的基本原理
数据恢复的前提是:数据不能被二次破坏、覆盖!也就是说,在数据恢复之前我们要确保待恢复数据的存储区不能写入新的数据。
2.1 硬盘基本结构
硬盘的内部一般由磁片、磁头、电子线路、电动机和定位系统几个部分组成。把具有磁性金属的物质或者玻璃镀在磁片表面上,很多磁片重叠在一起,共同形成了所谓的磁盘体,每一个磁片的正面和反面全都有一个磁头。
硬盘的数据存储是利用电、磁转换原理完成的,数据的存储与获取是利用柱面和磁头以及扇区,这三个部分对硬盘进行精确的访问,在磁片高速旋转时,在电路控制下磁头径向移动到指定位置后完成该操作。
柱面数,就是磁盘每一个面盘片上的柱面数,这个值允许的最大范围是1023;扇区数,就是每一条磁道上面的扇区数,这个值允许的最大范围是63,每一个扇区的大小是512B[1];磁头数表示磁盘总共有多少个磁头,这个值允许的最大范围是255。
2.2 硬盘存储结构
一块从市场新买回来的硬盘, 必须要按照一定的步骤进行三种操作才能正常使用,一是分区,二是格式化,三是安装操作系统。硬盘完成以上三种操作后,主引导扇区就会被建立,包括DPT(分区表)和MBR(主引导记录)、FAT(主引导记录)、DIR(根目录区)、DBR(操作系统引导扇区)、Data(数据区)五个部分。
其中MBR是通过FDISK建立起来的,它位于0柱面以及0磁头,是分区的1扇区,该系统所有的程序都在BIOS里面执行,完成后跳到它的第一条指令,最后将控制的权利交给它来执行。不同的OS可能会存在相同的MBR,即使不同,MBR也不会夹带OS的性质[2]。
DBR是操作系统访问的第一个扇区,它由FORMAT命令建立,是分区的第0扇区。该扇区主要包括两部分,分别是本分区参数记录块和引导程序。当引导程序得到MBR系统控制权的时候,它的作用就是判定本分区里面根目录中的前两个文件是否是该操作系统的引导文件。如果判定结果为是,就读入该内存,并得到控制权。
主引导记录表是主引导记录文件系统用于磁盘数据的索引以及定位的链式结构。一般FAT有两个,但它们功能不一样。第二个是为第一个进行备份,这样做的目的是为了保证数据更加安全。FAT区位于DBR之后,它们的大小通常由本分区的大小和文件中的单元大小决定。
FAT2之后就是DIR,它记录着各个文件的开始位置,它与前面的FAT相互配合,还会对文件精确定位它在硬盘中的具体位置。
比起前面各扇区的占用空间,DATA占用的空间比较大,它的功能仅仅是用来启动和管理整个硬盘。剩下的绝大部分空间则存储着用户需要的文件,即数据区。具体的硬盘信息存储结构如表1所示:
表1 硬盘信息存储结构
MBR(主引导记录) | 主引导程序 | |
DPT(分区表) | 分区项1 | |
分区项2 | ||
分区项3 | ||
分区项4 | ||
结束标志55AA | ||
DBR(OS引导扇区) | 一条跳转指令 | |
厂商标识和DOS版本 | ||
BPB参数 | ||
DOS引导程序 | ||
结束标志55AA | ||
FAT1(文件分配表1) | 一条跳转指令 | |
厂商标识和DOS版本 | ||
BPB参数 | ||
…… | ||
FAT2(文件分配表2) | FAT1的备份 | |
FDT(DIR的文件目录表) | IO.SYS | |
MSDOS.SYS | ||
MOMMAND.COM | ||
…… | ||
DATA(数据区) | 存储数据 |
写入文件的步骤如下:首先操作系统通过在DIR区找到没有使用的空区,把文件名以及文件类型等这些基本信息写入到空区;然后把文件内容写在DATA区的空白位置,DATA区中的第一个可分配单元写回到DIR区。
读取文件的步骤如下:首先操作系统从根目录区中,找到需要读取文件的所有基本信息以及第一个可分配单元的全部内容,并查找主引导记录中对应的单元号;然后再找到对应于该单元号的全部数据区的内容,通过这样的方式直到遇到结束标志FF时,宣布读取数据完成。
删除文件即是用户对文件的删除,包括文件彻底删除。但是在这个过程中,实际上并没有对文件内容中的数据区进行清除,只是在目录区中做了一个“E5”标记。只有在重新写入新的数据时,把原来的数据覆盖,才能把其彻底删除。
3 数据恢复的方法
3.1 数据软恢复法
3.1.1 基于恢复软件的数据恢复方法
由于系统故障、死机、病毒黑客的入侵、木马破坏、误操作等软件方面的故障所造成的系统崩溃以及文件丢失,都可使用各种恢复软件对其进行恢复。主要有:EasyRecovery、FinalData、WinHex等。这些当前流行的恢复软件之间各种情况的对比如表2所示。
表2 常用数据恢复软件对比
软件 | 支持功能 | 优点 | 缺点 | 扫描结果 |
Easyrecovery | 硬盘诊断、文件修复、邮件修复、可对映射网络驱动器进行操作 | 恢复效果不错,可修复Word和Zip文件,扫描方式多样 | 扫描速度慢,不能做深层目录直接恢复 | 以单独的目录方式显示和恢复 |
FinalData | 可对映射网络驱动器进行操作 | 扫描速度快,支持常见格式的图片和文本预览 | 不支持原始目录结构显示和恢复,扫描方式单一 | 以文件类型方式和全部方式显示 |
WinHex | 磁盘编辑器、磁盘克隆、驱动器镜像和备份、数据擦除、多文件寻替换、对比功能等 | 文件小,速度快 | 操作要求高,程序运行速度慢 | 显示十六进制HEX格式的数值和地址,旁边区域显示文件名称、大小、创建时间等相关信息 |
对存储数据安全的保护,唯一的解决方法是对数据进行备份。如果数据出现问题,就可以使用以前备份的数据进行系统或数据恢复,这样不仅可以保证对数据进行全新的恢复,而且数据的完整性恢复得相当高[3]。
武汉软件工程职业学院李国强指出数据备份恢复技术与信息安全管理有着重要的关系,其主要围绕下面3个方面进行:备份方案的选择(如表3所示)、备份策略的选择(如表4所示)、备份系统架构方式的选择(如表5所示)。
表3 备份方案的比较
名称 | 特点 | 适合备份数据的场合 |
CD-R光盘 | 安全性较高,可靠性高, 不可修改 | 资料文件的备份,可有限的增添、删除数据 |
CD-RW光盘 | 安全性较高,可靠性高, 可多次修改 | 资料文件的备份,可随时增添、删除数据 |
ZIP磁盘 | 性价比高,易备份 | 大量交换文件时使用 |
MO | 容量大,价格高 | 适合专业图形处理 |
大容量移动硬盘 | 最好的备份方案,除可备份外,还可存储大量的文件信息 | 适合所有用户 |
闪盘 | 容量小,使用方便 | 交换数据和临时备份 |
名称 | 内容 | 特点 |
完全备份 | 备份所有数据 | 恢复快,如备份量大,备份时间长 |
增量备份 | 主要是备份上一次备份完之后,现在更新的所有数据 | 数据备份数量非常少,恢复的时候需要多份增量备份以及全备份 |
差异备份 | 主要是备份上一次数据全备份之后所有更新的数据 | 介于完全备份和增量备份之间 |
累加备份 | 备份每一次变化后的值到相应数组,主要采用数据库的链接方式 | 可以恢复数据到指定的时间点 |
名称 | 采用技术 | 特点 |
DAS(直连式存) | 网络附加存储系统的备份系统 | 维护简单,传输速度快,适用于简单的文件备份,可管理的存储设备少,不利于共享,不支持实时备份 |
NAS(网络存储设备应用) | 网络技术 | 继承磁盘阵列的优点,摆脱了服务器与异构构架的束缚 |
SAN(网络存储技术) | 高速光纤通道SCSI技术 | 不占用LAN资源,增强了TCP/IP网络带宽的使用效率 |
云存储技术 | 群应用、网格技术、分布式文件系统等功能 | 提供数据存储、业务访问功能 |
当数据信息破坏比较严重或磁盘出现物理性损伤,比如盘体坏道、电路板芯片烧毁、盘体异响等故障所导致的数据丢失[4],单纯使用软件恢复数据可能难以达到预期的效果。最好的方法就是将数据恢复软件和专门的数据恢复仪器结合起来进行恢复。
这种仪器有适应各种存储介质的接口,可以很方便的插接硬盘、优盘、软盘、数码存储卡等各种存储介质,不同接口类型的磁盘也可以直接挂接。通常情况下,拿到一个要恢复的磁盘时,首先要对其进行检测,根据检测结果来确定是否可以恢复,以及能够在多大程度上进行恢复,并确定恢复策略。这种仪器还可以在恢复数据之前自动对要恢复的数据进行备份。
4 结 语
国内的数据恢复技术目前还不是非常成熟,而在国外,这种技术非常成熟,但对其更深一层的研究非常少。为了数据的安全,应该不断发展更深的技术,研发出新的技术并掌握它,这样才能使数据恢复的效率进一步提高。硬盘是有价格的,但是数据是无价的,所以应该重视数据安全这一重要的问题。在信息化时代,一定要重视对数据的保护。
参考文献
[1]张彦敏.基于IDE硬盘的数据采集存储系统研究[D].哈尔滨:哈尔滨工程大学,2005.
[2]曾琦华,黄少烈.夹带剂在银杏叶超临界CO2萃取中的应用研究[J].广东药学,2001(12).
[3]吕岚.论SQL Server 构架数据完整性约束的实现技术[J].甘肃科技,2008(10).
[4]吴开林.强拔移动盘,有多少数据可以重来[J].中国信息技术教育,2011(11).