备份存储技术基础知识(扫盲篇)

您所在的位置:网站首页 nas是什么方式存储技术 备份存储技术基础知识(扫盲篇)

备份存储技术基础知识(扫盲篇)

2024-07-12 12:08| 来源: 网络整理| 查看: 265

操作系统和应用系统相关知识

Windows常用版本:

PC(员工办公电脑或则笔记本): Windows 7/2000/xp/vista

Server(文件服务器、ERP服务器等应用服务器): Windows 2000 Server/2003 Server/2008 Server

Linux版本:

RedHat/RedFlag/Unbuntu/ Fedora/SUSE

Unix版本

AIX / HP-UX / Solaris / SCO OpenServer

常见的数据库有哪些?

Sybase

MS SQL Server 版本SQL2000/2005/2008

Oracle 版本 8i / 9i /10G / 11G

MS Exchange Server 2003/2007

IBM Lotus Domino

常见的邮件数据库有哪些?

MS Exchange Server

IBM Lotus Domino Server

常见的虚拟化平台有哪些?

VMware ESX/Citrix Xen Server/Windows Hyper-V

IIS和Apache是什么?

IIS与Apache都是WEB服务端程序,是网站运行的平台。IIS是Windows操作系统自带的web服务端程序;到目前为止Apache仍然是世界上用的最多的Web服务器,世界上很多著名的网站都是Apache的产物,它的成功之处主要在于它的源代码开放、有一支 开放的开发队伍、支持跨平台的应用(可以运行在几乎所有的Unix、Windows、Linux系统平台上)以及它的可移植性等方面。

典型应用:Windows+IIS+MS SQL Server +.net;Linux+Apache+Mysql+PHP。

VMware 虚拟机

EMC公司的VMware一套虚拟机解决方案的软件,用户能够在一台机器上面跑多台Windows/Linux系统环境。VMWare是真正“同时”运行,多个操作系统在主系统的平台上,就象标准Windows应用程序那样切换。而且每个操作系统你都可以进行虚拟的分区、配置而不影响真实硬盘的数据,你甚至可以通过网卡将几台虚拟机用网卡连接为一个局域网,极其方便。安装在VMware操作系统性能上比直接安装在硬盘上的系统低不少,因此,比较适合学习和测试。

硬件环境和网络环境相关知识

硬件环境:服务器、磁盘阵列与RAID卡

服务器品牌:IBM、HP、DELL、Lenovo、浪潮、清华同方、Sun、华硕、曙光、方正等。

服务器型号:IBM xSeries 346 8840-I09 (Xeon 3.2GHz/1GB/146GB)等。

RAID为廉价磁盘冗余阵列(Redundant Array of Inexpensive Disks),RAID技术将一个个单独的磁盘以不同的组合方式形成一个逻辑硬盘,从而提高了磁盘读取的性能和数据的安全性。不同的组合方式用RAID级别来标识。RAID技术是由美国加州大学伯克利分校D.A. Patterson教授在1988年提出的,作为高性能、高可靠的存储技术,在今天已经得到了广泛的应用。

RAID技术经过不断的发展,现在已拥有了从 RAID 0 到 5等6种明确标准级别的RAID 级别。另外,其他还有6、7、10(RAID 1与RAID 0的组合)、01(RAID 0与RAID 1的组合)、30(RAID 3与RAID 0的组合)、50(RAID 0与RAID 5的组合)等。不同RAID 级别代表着不同的存储性能、数据安全性和存储成本,下面将介绍如下RAID级别:0、1、2、3、4、5、6、01、10。

磁盘阵列品牌:EMC、IBM、Dell、HP、DELL、豪威、浪潮、Infortrend、清华同方、同有等。

磁盘阵列型号:EMC CLARiiON AX4、EMC CLARiiON CX3(10型)等。

RAID卡:RAID卡就是用来实现RAID功能的板卡,通常是由I/O处理器、SCSI控制器、SCSI连接器和缓存等一系列零组件构成的。不同的RAID卡支持的 RAID功能不同。支持RADI0、RAID1、RAID3、RAID4、RAID5、RAID10不等。RAID卡可以让很多磁盘驱动器同时传输数据,而这些磁盘驱动器在逻辑上又是一个磁盘驱动器,所以使用RAID可以达到单个的磁盘驱动器几倍、几十倍甚至上百倍的速率。这也是RAID卡最初想要解决的 问题。可以提供容错功能,这是RAID卡的第二个重要功能。

网络环境:

1)带宽

单位时间内能够在线路上传送的数据量,常用的单位是bps(bit per second),但是我们描述带宽时常常把“比特/秒”省略。例如,带宽是 10 M,实际上是 10 Mb/s。这里的 M 是 10^6。

2)字节(Byte)

字节是通过网络传输信息(或在硬盘或内存中存储信息)的单位。字节是计算机信息技术用于计量存储容量和传输容量的一种计量单位,1个字节等于8位二进制。在ASCII码中,一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。

3)符号

英文标点占一个字节,中文标点占两个字节。举例:英文句号“.”占1个字节的大小,中文句号“。”占2个字节的大小。

一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,如一个ASCII码就是一个字节,此类单位的换算为:

1千吉字节(TB,Terabyte)=1024吉字节(2的40次方字节)

1TB=1024GB

1吉字节(GB,Gigabyte)=1024兆字节(2的30次方字节)

1GB=1024MB

1兆字节(MB,Megabyte)=1024千字节(2的20次方字节)

1MB=1024KB

1千字节(KB,Kilobyte)=1024字节(2的10次方字节)(1KB=1024B)

1字节(Byte)= 8位(bit)

注:TB是现在电脑硬盘最大的存储量单位。10TB大约等于一个人脑的存储量。

更大的单位,还有 PB(Petabyte,1PB=1024TB)、EB(Exabyte,1EB=1024PB)、ZB(Zettabyte,1ZB=1024EB)、YB(Yottabyte,1YB=1024ZB)

4)局域网(Local Area Network),简称LAN

指在某一区域内由多台计算机互联成的计算机组。“某一区域”指的是同一办公室、同一建筑物、同一公司和同一学校等,一般 是方圆几千米以内。局域网可以实现文件管理、应用软件共享、打印机共享、扫描仪共享、工作组内的日程安排、电子邮件和传真通信服务等功能。局域网是封闭型的,可以由办公室内的两台计算机组成,也可以由一个公司内的上千台计算机组成。

5)广域网(Wide Area Network),简称WAN

一种跨越大的、地域性的计算机网络的集合。通常跨越省、市,甚至一个国家。广域网包括大大小小不同的子网,子网可以是局域网,也可以是小型的广域网。

6)专线

就是使用光纤或者有线电缆专门给你布的线路,使用专有固定的IP地址,带宽有保证的上网方式! 有一定的保密作用但是价格昂贵,一般人负担不起。

7)虚拟专用网(×××)

被定义为通过一个公用网络(通常是因特网)建立一个临时的、安全的连接,是一条穿过混乱的公用网络的安全、稳定的隧道。虚拟专用网是对企业内部网的扩展,可以帮助远程用户、公司分支机构、商业伙伴及供应商同公司的内部网建立可信的安全连接,并保证数据的安全传输。通过将数据流转移到低成本的网络上,一个企业的虚拟专用网解决方案将大幅度地减少用户花费在城域网和远程网络连接上的费用。同时,这将简化网络的设计和管理,加速连接新的用户和网站。另外,虚拟专用网还可以保护现有的网络投资。随着用户的商业服务不断发展,企业的虚拟专用网解决方案可以使用户将精力集中到自己的生意上,而不是 网络上。虚拟专用网可用于不断增长的移动用户的全球因特网接入,以实现安全连接;可用于实现企业网站之间安全通信的虚拟专用线路,用于经济有效地连接到商业伙伴和用户的安全外联网虚拟专用网。

存储知识

随着数据量的增加,存储变得必不可少,目前的存储架构有以下三类:

DAS:直接附加存储:

DAS(Direct Attached Storage—直接附加存储)是指将存储设备通过SCSI线缆或光纤通道直接连接到服务器上。

一个SCSI环路或称为SCSI通道可以挂载最多16台设备;

FC可以在仲裁环的方式下支持126个设备;

DAS方式实现了机内存储到存储子系统的跨越,但是缺点依然有很多:

l 扩展性差,服务器与存储设备直接连接的方式导致出现新的应用需求时,只能为新增的服务器单独配置存储设备,造成重复投资。

l 资源利用率低,DAS方式的存储长期来看存储空间无法充分利用,存在浪费。不同的应用服务器面对的存储数据量是不一致的,同时业务发展的状况也决定这存储数据量的变化。因此,出现了部分应用对应的存储空间不够用,另一些却有大量的存储空间闲置。

l 可管理性差,DAS方式数据依然是分散的,不同的应用各有一套存储设备。管理分散,无法集中。

异构化严重,DAS方式使得企业在不同阶段采购了不同型号不同厂商的存储设备,设备之间异构化现象严重,导致维护成本据高不下。

NAS(Network Attached Storage—网络附加存储)

NAS(Network Attached Storage—网络附加存储),是一种文件共享服务。拥有自己的文件系统,通过NFS或CIFS对外提供文件访问服务。

NAS包括存储器件(例如硬盘驱动器阵列、CD或DVD驱动器、磁带驱动器或可移动的存储介质)和专用服务器。专用服务器上装有专门的操作系统,通常是简化的unix/linux操作系统,或者是一个特殊的win2000内核。它为文件系统管理和访问做了专门的优化。专用服务器利用NFS或CIFS,充当远程文件服务器,对外提供文件级的访问。

NAS的优点:

l NAS可以即插即用。

l NAS通过TCP/IP网络连接到应用服务器,因此可以基于已有的企业网络方便连接。

l 专用的操作系统支持不同的文件系统,提供不同操作系统的文件共享。

l 经过优化的文件系统提高了文件的访问效率,也支持相应的网络协议。即使应用服务器不再工作了,仍然可以读出数据。

NAS的缺点:

1)NAS设备与客户机通过企业网进行连接,因此数据备份或存储过程中会占用网络的带宽。这必然会影响企业内部网络上的其他网络应用。共用网络带宽成为限制NAS性能的主要问题。

2)NAS的可扩展性受到设备大小的限制。增加另一台NAS设备非常容易,但是要想将两个NAS设备的存储空间无缝合并并不容易,因为NAS设备通常具有独特的网络标识符,存储空间的扩大上有限。

3)NAS访问需要经过文件系统格式转换,所以是以文件一级来访问。不适和Block级的应用,尤其是要求使用裸设备的数据库系统。

SAN:存储区域网络

SAN(Storage Aera Network )存储区域网络,是一种通过网络方式连接存储设备和应用服务器的存储构架,这个网络专用于主机和存储设备之间的访问。当有数据的存取需求时,数据可以通过存储区域网络在服务器和后台存储设备之间高速传输。

SAN的发展历程较短,从90年代后期兴起,由于当时以太网的带宽有限,而FC协议在当时就可以支持1Gb的带宽,因此早期的SAN存储系统多数由FC存储设备构成,导致很多用户误以为SAN就是光纤通道设备,其实SAN代表的是一种专用于存储的网络架构,与协议和设备类型无关,随着千兆以太网的普及和万兆以太网的实现,人们对于SAN的理解将更为全面。

SAN由服务器,后端存储系统,SAN连接设备组成;

后端存储系统由SAN控制器和磁盘系统构成,控制器是后端存储系统的关键,它提供存储接入,数据操作及备份,数据共享、数据快照等数据安全管理,及系统管理等一系列功能。

后端存储系统为SAN解决方案提供了存储空间。使用磁盘阵列和RAID策略为数据提供存储空间和安全保护措施。

连接设备包括交换机,HBA卡和各种介质的连接线。

SAN的优点:

l 设备整合,多台服务器可以通过存储网络同时访问后端存储系统,不必为每台服务器单独购买存储设备,降低存储设备异构化程度,减轻维护工作量,降低维护费用;

l 数据集中,不同应用和服务器的数据实现了物理上的集中,空间调整和数据复制等工作可以在一台设备上完成,大大提高了存储资源利用率;

l 高扩展性,存储网络架构使得服务器可以方便的接入现有SAN环境,较好的适应应用变化的需求;

总结:

    备份存储技术基础知识(扫盲篇)_Windows

DAS、NAS、SAN三种存储模式,已经很好地满足目前企业信息化应用在单服务器扩容、服务器双机高可用集群、高性能、高可用、高扩展的网络存储和简单易用的网络文件共享等方面的需求。随着信息化建设朝深度和广度发展,新兴的存储模式也必将会逐步走向普及应用。

NAS和SAN的优劣已经停止了争论,现在一个比较一致的看法是:NAS可以很经济地解决存储容量不足的问题,但难以获得满意的性能,对于关键事务应用而言,它必须使用专用的宽带网络。因此,如果公司的发展将需要大量的NAS设备或是网络带宽需求超过千兆以太网,就应该考虑最高端的存储解决方案SAN。SAN与NAS体系的融合正在积极发展。这种融合存在其合理性,SAN提供速度,NAS提供由文件处理带来的协作性。

对SAN来说,点到点之间光纤通道的最大距离不得超过10km限度是一个瓶颈,但这种缺陷可以被NAS的IP连结所弥补。也就是说,可以通过IP网络发送 光纤通道命令(FC/IP)。借助于先进的以太网技术,这种处理方法最终变成了现实。融合NAS/SAN技术的呼声很高,现在已经出现类似产品。

备份基础

备份存储技术基础知识(扫盲篇)_笔记本_02

 什么是备份:备份就是把某一时间点的数据备份到介质中,形成不同时间点的副本。

数据备份的作用与意义:

众所周知,很多情况下可能导致我们的数据丢失,比如:软硬件故障,灾难事件,人为误操作,病毒入侵,以及我们想保留我们的历史数据。为了让数据更安全,我们就应该对数据做数据备份。

数据备份的类型:

完全备份:备份全部选中的文件夹,并不依赖文件的存档属性来确定备份那些文件。(在备份过程中,任何现有的标记都被清除,每个文件都被标记为已备份,换言之,清除存档属性)。完全备份特点是备份所需时间最长,但恢复时间最短,操作最方便可靠。

差异备份:差异备份是针对完全备份:备份上一次的完全备份后发生变化的所有文件。(差异备份过程中,只备份有标记的那些选中的文件和文件夹。它不清除标记,既:备份后不标记为已备份文件,换言之,不清除存档属性)。差异备份特点是备份时间较长,占用空间较多,但恢复时间较短。

增量备份:增量备份是针对于上一次备份(无论是哪种备份):备份上一次备份后,所有发生变化的文件(增量备份过程中,只备份有标记的选中的文件和文件夹,它清除标记,既:备份后标记文件,换言之,清除存档属性。)。增备备份特点是备份时间较短,占用空间较少,但恢复时间较长。

备份存储技术基础知识(扫盲篇)_服务器_03

我们公司的产品使用的备份策略是:完全备份和增量备份相结合的方式。

磁盘备份和磁带备份:

磁盘和磁带备份的区别就是备份存放介质的不同,一种是存放于磁盘之中一种是存放于磁带之中,而这两种各有各的优缺点,但是,随着技术的发展,我们看到,磁盘备份正在成为一种趋势,所以爱数选择的备份是磁盘备份。

磁带备份:优点:价格低廉,保存时间较长(20年以上),适合用作历史数据的存档;缺点:不能随机访问,如果要访问中间某段,必须从头开始顺序访问.磁盘显然可以直接定位到任意数据,读写速度非常慢。

磁盘备份:优点:直接的访问数据,因为不需要加载或倒带,读写速度很快。缺点:价格高昂,易坏,不能长期保存。

备份架构

目前最常见的网络数据备份系统按其架构不同可以分为四种:基于网络附加存储(Host-Based)结构,基于局域网(LAN-Based)结构,基于 SAN 结构的 LAN-Free 和Server-Free结构。下面对这几种结构作具体介绍:

1)Host-Based结构

Host-Based是传统的数据备份的结构,这种结构中磁带库或磁盘阵列直接接在服务器上,而且只为该服务器提供数据备份服务。在大多数情况下,这种备份大多是采用服务器上自带的磁带机,而备份操作往往也是通过手工操作的方式进行的。

Host-Based备份结构的优点是数据传输速度快,备份管理简单;缺点是不利于备份系统的共享,不适合于现在大型的数据备份要求。

2)LAN-Based结构

LAN-Based备份,在该系统中数据的传输是以网络为基础的。其中配置一台服务器作为备份服务器,由它负责整个系统的备份操作。磁盘阵列则接在某台服务器上,在数据备份时备份对象把数据通过网络传输到磁盘阵列中实现备份的。(如下图所示)

备份存储技术基础知识(扫盲篇)_Windows_04

LAN-Based备份结构的优点是节省投资、存储介质共享、集中备份管理;它的缺点是对网络传输压力大。

3)SAN 结构

LAN-Free和Server-Free的备份系统是建立在SAN(存储区域网)的基础上的。基于SAN的备份是一种彻底解决传统备份方式需要占用LAN带宽问题的解决方案。它采用一种全新的体系结构,将磁带库和磁盘阵列各自作为独立的光纤结点,多台主机共享磁带库备份时,数据流不再经过网络而直接从磁盘阵列传到磁带库内,是一种无需占用网络带宽 (LAN-Free) 的解决方案,目前随着SAN技术的不断进步,LAN-Free的结构已经相当成熟,而Server-Free的备份结构的实现也慢慢开始成熟。LAN-Free的优点是数据备份统一管理、备份速度快、网络传输压力小、磁带库资源共享;缺点是投资高。

备份和拷贝、归档的区别

备份不能仅仅通过拷贝完成,因为拷贝不能留下系统的注册表等信息;而且也不能留下历史记录保存下来,以做追踪;当数据量很大时,手工的拷贝工作又是何其麻烦。备份=拷贝+管理。管理包括备份的可计划性、磁带机的自动化操作、历史记录的保存以及日志记录等等。

正如生命周期理论将在线数据分级为在线和近线数据一样,离线数据亦可分为备份与存档数据,以降低投资和运维成本。

存档的目的是将需要长期备查或转移到异地保存/恢复的数据存放到可移动存储介质上。严格意义上讲,存档的目的不是为了保障数据安全,而只是为了实现数据仓储。如果说备份相当于桌头的字典,工作时会经常翻用,存档则好像日常工作中生成的一些具长期保存价值的文字资料,被转移到书架上或档案馆里备查。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3