分级存储架构的三个层次
三个层次 应用特点 在线存储 在线存储主要用来支撑用户的实时在线业务,通常采用 高速磁盘存储阵列,如sas磁盘阵列、fc磁盘阵列等,具有较高的性能。与离线存储相比,在线存储容量较小,但能耗较高 近线存储 近 线存储不仅可以解决离线存储性能较低的问题,还能大幅减少系统的备份与恢复窗口。近线存储通常使用低速、大容量的磁盘设备来仿真磁带设备,称为虚拟磁带库 离 线存储 对海量数据进行归档,可以采用磁带作为存储介质,虽然访问速度较低,但价格低廉 数据分级存储是指将数据存 放在不同级别的存储设备(磁盘阵列、磁带库、光盘库)中,并通过分级存储管理软件实现数据在存储设备之间的自动迁移。用户可以根据数据的访问频率、保留时 间、容量、性能要求等因素确定{zj0}存储策略。 数据分级存储的工作原理是基于信息生命周期管理(ilm),通过将不经常访问的数据自动迁 移到存储层次中较低的层次,从而释放高成本、高能耗的存储空间给更频繁访问的数据,这样可以获得更好的xxx。 另外,通过将访问频率较 低的数据备份到离线的存储介质(如磁带)中,可以更有效地利用有限的资源,显著降低维护这些数据带来的开销,同时又可以满足相关法规的规定。 通常情况下,多级存储系统可分为三个层次,即在线存储、近线存储和离线存储。 提高资源使用率 将使用率低的数据迁移 到功耗低的设备上,尤其是将数据迁移到大容量的离线设备上,可以释放这部分数据占用的系统资源,提高资源使用率,减少相关存储设备的数量,从而有效减少存 储设备的电力需求,保证重要在线业务的能源需要,同时减少降噪、冷却带来的额外能源开销。 采用不同存储设备 在线存 储、近线存储和离线存储对系统的性能要求各不相同。 在线存储对性能要求较高,可以采用高速的磁盘设备。但采用高速磁盘作为在线存储设备 时,其能耗要高于低速的磁盘设备(如sata磁盘等)。比如,fc磁盘正常工作时的功耗为27.73w,但大容量的sata磁盘正常工作时的功耗仅为 12.8w。如果保存100tb的数据,需要的fc磁盘与sata磁盘的数量分别为334个(以每个fc磁盘容量300gb计算)和100个(以每个 sata磁盘容量1tb计算)。为保证这些磁盘的运行,fc磁盘与sata磁盘的电力需求分别为9262w和1280w(不包括raid等额外的磁盘开 销)。从这一点可以看出,在近线存储设备中,采用高容量的低速磁盘来存储不经常访问的数据,可以大幅降低能源的消耗,达到节能的目标。 与磁带设备相比,近线存储采用磁盘设备,可以大幅提高系统的备份与恢复速度。以华为赛门铁克公司的vtl3605虚拟磁带库为例,其备份速度可以达到 1.5tb/h,但离线存储的备份速度只有288gb/h。仅从这一点来衡量,虚拟磁带库的备份速度远远高于磁带设备。 在实际应用中, 用户可以综合考虑性能与业务的需求,将对实时性要求较高的关键业务放到高速、高能耗的在线设备上,而将对实时性要求较低的数据迁移到低能耗的近线设备上, 从而有效降低能源的开销。 固态硬盘(ssd)兼顾了性能与环保的要求,可用于在线存储,以降低系统能耗,并提高系统的性能。但由于 ssd的成本较高,目前还没有得到普及。 减少设备占用空间 为了满足日益增长的数据存储需求,用户不得不购买更多的物 理磁盘。高速的sas磁盘最多只能提供300gb的存储空间,而低速的sata磁盘则可以提供高达1tb的存储空间。用户可以将访问频率较低的数据从在线 的高速磁盘迁移到大容量的存储设备上,释放宝贵的在线资源给关键业务。此外,近线系统可以采用大容量的低速存储设备以及空间利用率较高的raid 5算 法,并对数据进行及时归档,从而减少磁盘使用量,减少机房的设备占用空间,避免扩容的风险。 随时释放存储资源 分级存 储是根据信息生命周期管理策略对数据进行管理的。将那些过期无用的数据及时从设备中删除,也可以达到节约资源的目的。华为赛门铁克综合考虑数据的属性,在 条件允许的情况下尽量采用数据分级存储的方式保存数据,从而达到节能的目标。
■ 华为赛门铁克科技有限公司 贾生宁 |