- A+
“钱经理,你看看到底是怎么回事?”周一刚上班,老板就把一份文件甩到了还没落座的钱经理面前。
定睛一看,钱经理发现是一个客户发来的函,大意是虽然三年的质保期快到了,但还是要钱经理所在的公司提供免费服务,因为钱经理当初承诺了。
“你是不是当初信口就许诺了?要知道本来那个项目就不挣钱,现在还要继续免费服务,你让公司赔本赚吆喝啊!”老板绷紧了脸。
“冤枉啊!虽说当初咱们为了接这个活,不惜委屈求全,但我也没有到这个地步。我记得当初专门发了一封邮件,就三年质保期过后的售后服务提出了收取一定的费用,他们那边的马总也答应了,只是最后没有写到合同里。”钱经理委屈地说。
“那你把邮件找出来啊。要不然口说无凭。”老板说完转身就走了。钱经理赶紧忙碌起来。
谈需求
法规日臻完善,归档存储势在必行
还算幸运的是,钱经理所在的公司对业务往来的邮件比较重视,每过三个月就把一些重要的商务邮件备份出来。但即使是这样,要找出三年前的邮件谈何容易。
钱经理也没有办法,只好硬着头皮在公司的存储设备上找。费了九牛二虎之力,钱经理还真是幸运地找到了那封邮件。
对方见找出了最初的证据,也就不好再坚持,最后双方商定了一个服务协议,平稳地解决了这个问题。
一想到这件事,钱经理总觉得有点窝囊:要不是公司重视,加以备份,这个黑锅自己就背定了;虽然有备份,但才三年查起来就这么麻烦,要是五年、十年,那该怎么办?
和老朋友i博士、欧主管聚在一起后,钱经理把自己的困惑提了出来。“你们公司有备份意识,还真不错。关键还是要进行归档存储,这样查找起来就很方便了。”i博士提出了自己的看法。
见大家听得认真,i博士便从备份和归档的差别说起,以更好地解释归档存储。
备份是当生产环境内发生变动时生成的信息拷贝,这个拷贝可被恢复,以保证生产正常进行。由于备份关注的是业务信息的变更,所以新的拷贝总比旧的拷贝更受欢迎。备份通常是短期的,而且经常被覆盖。
归档的作用并不限于“恢复”一个应用程序或一个业务,还要能够方便地检索。这种检索通常在一个文件、一份电子邮件或其信息内容中进行。因此,归档并不是生产数据的“拷贝”,而是一段信息的基础版本,经常是当前失效的或不再改变的数据。
实际上,当数据停止改变或不被频繁使用时,最好把它们转移到一个文档,使之存于日常的备份窗口之外,但仍能随时接入。一个好的存储归档系统可以帮助企业实现以下目标:降低保留历史数据的成本;更有效和快捷的历史数据访问和利用;减少保护和维护信息所需的人力管理成本;保护归档数据的安全性。
“这几年,各个行业要求保留数据用于主动参考的法规在不断增加,如金融服务、医疗保健、电信、生命科学和政府等部门。这些数据对信息管理员来说就是参考信息,其中,作为基本通讯方式的电子邮件,正在成为参考信息的重要组成部分。”i博士说。
以一个拥有500名员工的企业而言,每个员工平均每天要收发76封邮件,这意味着每周会有19万封邮件,一年内将产生接近1000万封电子邮件。此外再加上邮件中的附件等,如何管理并搜索这些数据,使这些电子邮件数据产生价值,会让企业感觉就像大海捞针一样。
“其实,不光是电子邮件,其他像一些公司发的文件、重要的业务往来文档等,都需要进行归档存储。”i博士继续解释说。
由于应用目的的不同,数据保存和使用的策略也不相同,归档系统可以说是一个相当客户化、定制化的系统。另外,谈及归档存储,就不得不和分级存储结合起来。
数据的分级存储,就是按照数据所处不同阶段的重要性和使用频率的差异,将它们存储在最适宜的存储设备中,从而实现有效的管理和最低的成本。比如,在线数据通常存储在价格较高、可靠性较高的SCSI盘阵或光纤盘阵中,近线数据通常存储在价格相对便宜的SATA盘阵中,而离线数据则保存在磁带设备中。
“这样,企业的数据就不怕找不到了,成本也能尽量节省。”欧主管在一旁听得也大受启发。
i博士点评
数据的归档存储已经成为企业信息化的一个必须部分,但并不意味着任何归档存储都需要大型的存储设备。譬如一些小型企业,每周会将数据传到一台PC机上,刻录到CD-ROM光盘上,对光盘标号后放到柜子里。这也是一种存储归档。
话采购
提前制定规划,选择合适方案
i博士点评
有规律并始终如一地备份数据,是昂贵、消耗时间和有疑问的方法,特别是当保存在生产环境中的数据只有很小比例实际上真正被使用的时候。没有一定的归档策略,企业可能会重复地备份那些没有被访问或更改而几乎荒废的数据。
“听你说了这么多,那我们如果真的要实现归档存储,又该怎么办呢?”钱经理受了一回惊吓,再也不想下次还遇到这种事了。
“归档技术其实很多,关键是企业要制定好自己的归档策略,这样实现起来才能有的放矢。”i博士建议到。
目前,帮助企业整合备份、恢复和归档的新技术有很多。例如归档,有用于各种各样应用程序的软件工具。这些软件工具与应用程序一起,找出静态数据,并将静态数据根据定义的条件,从主要系统移到第二存储层。
这样,信息仍可在线应用,但离开了日常备份窗口,转移到一个低成本的存储介质上。电子邮件和文件服务数据均可如此办理。数据库归档和企业内容管理解决方案,也有助于机构把静态信息从生产环境中转移出来。
用于归档的存储平台也同样重要。理想的情况是,归档存储系统应能满足长期保存活跃归档数据的需求,并易于扩展和管理,总拥有成本也要低于生产环境。
先进的归档平台还能保证内容的真实性、内容位置独立性以及具有内置复制功能。基于策略的数据归档于简单的文件备份相比的优点在于,客户可以更为迅速取回委托人请求或法规遵从涉及的数据。根据内容和业务价值管理数据将代替对业务关键应用的大量备份工作。
此外,企业一旦真正开始进行数据的归档存储,可能会面临如下的问题:
1、费用问题:参考(归档)数据的数量会不断增长,越来越多;由于高性能需求需要采用磁盘进行归档,但磁盘存储的管理费用比磁带更高。
2、内容管理问题:归档数据与具体应用和系统紧密联系在一起,内容局限于应用和系统中使用,归档的内容随着应用和系统一起生,也随着应用和系统一起死;现在的存储系统不能防止归档内容在未来不能使用;参考数据必须具有比系统和存储设备更长的生命力。
3、性能问题:用户需要归档数据在线存储,实现快速搜索和获取;随着内容的数量不断增加,需要更高的存储带宽;为了节省存储空间归档时采用压缩技术,但数据压缩会引起额外的性能消耗。
4、规模管理问题:归档存储规模不断增长,但TB到PB级集中存储将导致出现性能瓶颈。并且,在这样的大容量存储系统中,在全部内容上进行搜索非常不方便。
对此,解决上述问题的办法包括:
1、高效率的归档存储:通过消除冗余改进存储效率;利用文件之间和文件内的相同和相似性实现压缩。
2、内容管理:归档时提取元数据,采用元数据管理内容,实现基于对象的存储;创建归档存储接口,消除复制和实现主动自监控。
3、存储管道化:采用一个管道化的存储进程,实现缓存、数字水印、相似性检测、复制消除、写盘操作管道化;在节点内和节点间进行资源调度。
4、分布式归档存储:使用一个分布式体系结构,实现集群存储,减少元数据的搜索空间,提供元数据搜索效率。
“总之,企业在上存储归档系统之前,需要全面分析自身的业务应用需求,通过对自身业务的全面分析,对其业务进行数据量化,并做出针对业务数据的长远规划。同时,按照业务数据的关键性、价值和生命周期进行归类,并结合企业现有的存储系统环境,选择和制定适合自身的存储归档解决方案。”i博士总结道。
产品推介
EMC Centera
EMC BURA解决方案
作为存储领域的资深厂商,EMC首先意识和提出了存储要从BURA(备份、恢复、存档)整体策略考虑,才能适应当前用户不断变化需求的观点,并推出了切实可行的解决方案。
EMC公司提供经过测试和实战检验的解决方案,其中融合了BURA硬件、软件以及设计和实施服务,协助用户加快速度在自己的环境中实现价值。它包括:
备份至磁盘解决方案 该解决方案包括EMC评估、部署和管理服务,以及业界范围广泛的存储平台、成文的规范做法以及备份和恢复功能。
为备份解决方案聚合数据 替代不必要和低效的远程流程,采用更为可靠的单个集中备份流程,从而强化数据保护,降低复杂性。这一解决方案融合了EMC评估、部署和管理服务以及分层存储硬件和EMC OnCourse文件迁移软件,能够自动实现安全的边缘至核心文件移动。
电子邮件存档解决方案 它将评估、设计和实施服务,与电子邮件存档功能以及分层存储平台系列融为一体,在用户的Exchange和Lotus电子邮件环境中,采用集中方式应用内容管理和电子邮件存档策略。
IBM DR550
IBM DR550和LockVault
IBM专为归档而设计的存储产品有两个:DR550和N系列产品的LockVault。
DR550是硬件,包含了双路控制器、双路磁盘阵列控制器、SATA磁盘系统和可选的磁带系统。核心软件是TSM Data Retention。
归档的数据被送到与归档相关联的应用中。这种应用可能是用户自己开发的程序,也可以是市场上其他商业应用。例如内容管理软件(IBM CM)、档案管理软件等。
这些应用将数据处理后(例如,给扫描的单据编索引),归档数据最终存储在DR550中。将数据送入或调出DR550是通过API实现的。DR550使用管理员定义的策略来管理进入DR550的数据,例如存在多久、存在于哪级存储上、保存多久等。而且即使是最高权限的管理员也无法删除或改写数据。
N系列是IBM存储产品中NAS系列产品,而LockVault是基于N系列产品上的一个软件。其工作原理是LockVault将原存储于N系列中的数据转储到一个只读的、成本更低廉的磁盘中。该功能是N系列控制器完成,无需应用程序介入。
HDS NSC55
HDS虚拟化存储解决方案
HDS基于控制器的虚拟化存储解决方案可以帮助企业实现并优化分层存储,从而完善存储归档,满足法规遵从和成本控制需求。
日立TagmaStore USP和NSC采用基于控制器的虚拟化技术,允许内部和外部存储资源以一个统一的整合存储池的形式出现。该技术允许将HDS、EMC、IBM和Sun的存储系统连接到TagmaStore USP或NSC,将它们整合为一个单一的存储池,从而提供一个完整的分层存储配置。
例如,一个三层配置的分层存储系统可以将内部日立TagmaStore USP卷定义为第一层,将EMC Symmetrix系统定义为第二层,将带有SATA磁盘的日立TagmaStore Adaptable Modular Storage存储系统定义为第三层。
对多租用和虚拟专用机的支持,加上大量的连接,允许所有存储层资源的安全共享。利用基于控制器的虚拟化技术,HDS提供的分层存储解决方案能够帮助企业完整和安全地保存数据,并允许企业能够随时方便地检索并恢复它们,从而满足企业法规遵从和成本控制的需求。
此外,HDS将于2006年第二季度发布一个动态归档解决方案,以满足用户对长期、有效保存内容的解决方案不断增长的需求。
VERITAS Enterprise Vault
赛门铁克VERITAS Enterprise Vault
赛门铁克VERITAS Enterprise Vault提供邮件归档及查询能力,通过自动、策略控制的归档管理内容并在线存储。
归档信息根据确定的保存周期进行管理,因此不同类型的信息可使用不同的保存周期。同时,信息部署也可以通过制定策略进行管理。用于诉讼支持及监测/监控的客户端应用软件,对Enterprise Vault强大的内嵌搜索及查询功能进行了补充。
Enterprise Vault能对超过270种文件类型提供索引支持。这也意味着除了在邮件中,也可以在微软Office文件(例如.pdf、.doc、.txt、.xls等格式)或其它的邮件附件中定位信息,即使这些文件被压缩成.zip的格式。
赛门铁克Enterprise Vault可使机构自动遵从政策要求,将邮件及相关文件存档于一个可全面检索和查询的在线资料库中。Enterprise Vault软件根据既定的保存周期管理资料库中的信息,保存周期可根据不同的信息类型分别确定。所有内容都被编入索引,从而在需要时可快速获取。
对于Exchange站点,Enterprise Vault在允许终端用户畅通无阻地访问存档项目的同时,还可保存邮箱及后缀为.PST的文件。这通常可免除设置邮箱容量的需求,从而减少用户将邮件移至.PST文件的需要。
HP StorageWorks参考信息存储系统
针对企业信息归档方面的巨大需求,HP提供了StorageWorks 参考信息存储系统(RISS)。它是一个完全集成、高度可扩展的活跃的归档解决方案,包括硬件、软件、服务与支持。RISS还针对电子邮件、Microsoft Office和Adobe PDF文件进行了优化,成为HP信息生命周期管理解决方案的重要组成部分。未来,RISS将支持更多数据类型。
借助HP存储网格计算理念、智能存储细胞、元服务器以及管理软件,RISS自动收集电子邮件等主系统上的数据,减缓信息的过度增长,控制存储成本。系统实现较高的可扩展性,从TB扩展到PB级数据的同时不会降低性能。通过网格计算架构实现电子邮件的全内容索引,便于快速搜索和检索,有效地利用了用户的信息资产。加盖时间戳和进行验证,帮助客户遵守数据保留法规。
而且,RISS还拥有强大的索引和档案搜索工具及在线访问能力。
HP RISS系统示意图
专家观点
电子邮件成为法规遵从的重点
中国惠普网络存储产品部产品经理 郑亮
在法规遵从被企业存储列入重要需求之后,ESG(企业策略组织)最近进行了一项题为“数据保护的演变”(The Evolution of Data Protection)的研究。统计数据表明,46%的用户打算在今后至少两年时间里只使用磁带进行备份,29%的用户打算使用磁带和磁盘共同实施数据的备份,可见未来磁带存储市场的广阔。
不过,中国目前并没有与数据存储相关的法律法规,看上去法规遵从与中国存储市场的关系不大。但实际上由于跨国公司的进入,很多美国公司在中国的分公司、合资企业甚至于合作伙伴,都需要遵循美国的这些法律与法规。在这种大趋势下,中国的存储市场需求也将同样与国际市场保持同步。
目前,各个行业要求保留数据用于主动参考的法规在不断增加,如金融服务、医疗保健、电信、生命科学和政府等部门,而这些数据对信息管理员来说就是参考信息。其中,作为基本通讯方式的电子邮件,正在成为参考信息的重要组成部分。
存储归档是大势所趋
HDS解决方案中心技术顾问 于鹏
越来越多的新法规提出了关于数据举证能力的要求,要求政府和私营企业留存并保护业务信息。仅在美国就有超过 15,000 部由联邦或州立法机构起草的有关适当信息处理的法律和法规。
这些法规规定了哪些记录必须创建、存储、访问、维护和保存的全过程,并所要求的保存时间越来越长,在某些情况下甚至会超过一个人的寿命。
此外,国内关于企业经营运作的法规体系日渐成熟,各行业的监管力度日益加大和完善,加上越来越多的国内企业与国际接轨,这些大型企业也需要考虑相关的法规遵从,并对财务报表、公司往来信息以及电子邮件等文档提出了归档需求。
然而,满足法规监管要求并非易事,这不仅需要完整和安全地保存数据,还需要随时方便地检索并恢复它们。以上因素都导致企业需要长期保存和随时调用的数据量快速增长,直接促使存储归档产品和解决方案市场的日益火爆。
邮件归档降低企业风险
赛门铁克中国区解决方案市场经理 张衡
鉴于电子邮件现已成为一种非常重要的业务工具,这种在“电子邮件查询”调查中,电子邮件成为调查目标的现象也就不足为奇了。除了提供基本的通讯功能外,电子邮件目前还可储存大量商业信息。根据企业战略集团(Enterprise Strategy Group)的行业分析,超过70%公司的知识产权信息存放于其用户的电子邮箱中。
通过部署邮件归档及查询软件技术,可以将公司所有的邮件记录保存在一个安全的存储库中,便于每日业务应用。在响应电子查寻要求时,完善的解决方案也可使查询及访问变得快速、完整。部署该项技术后,用户将需要一个主动的企业邮件保存查询策略,以确保公司机构遵从邮件保存法律,避免由于无法提供全部所需信息而遭受重罚的风险。
对于公司的IT高层而言,一旦意识到健全的邮件保留策略价值,电子邮件查询问题实际上为他们提供了机会。
实施时注意综合考虑成本
IBM资深存储系统专员、华东区存储部技术经理 金微
存储归档系统由3个主要部分组成:需要归档的数据源,例如扫描成图片文件的投保信件函;归档数据处理应用,例如投保函的检索应用;存储设备,包括存储硬件如SATA磁盘,软件如TSM Data Retention。
实施中要注意的问题也是围绕以上3个部分,各应用不尽相同。特别要注意两点:
1、这三部分之间的相互连接性。因为这三部分一般是由不同供应商的产品和服务组成的。
2、长期拥有成本。归档数据系统往往是进入的数据远远大于过期被删除的数据,因此存储量累积增长很快,需要从长计议考虑成本。
至于日常管理的窍门,这可能很难有通用的标准,而且由于数据存储归档一旦实施后,基本是一个自动化的过程,不需要太多的人为干预。可能需要关注是的存储空间,在所有空间耗尽之前,及时升级存储。
青岛大学医学院附属医院PACS系统案例
医疗影像信息化技术的飞速发展,使得PACS系统日益成为各级医院实现信息化建设的重要组成部分。PACS能解决档案存储与管理问题,实现信息资源共享,使医院影像分析与存储水平提高、手段更新。
对于医院PACS系统来说,数据存储归档是PACS的基本任务及功能要求。存储架构模式和应用设备的选择等,对系统的响应速度存在着显著的影响。 EMC公司为青岛大学医学院附属医院PACS系统提供的Centera数据集中归档存储方案,就是一个非常典型的PACS系统数据存储案例。
青岛大学医学院附属医院PACS系统结构图
EMC针对青岛大学医学院附属医院的现状,以及考虑到未来的发展,将PACS存储系统分为两级存储:其一级存储SAN由EMC Clariion CX700构成,用于存储应用程序的数据库和短近期的医疗图像的缓存,满足经常和快速的访问要求;通过IP连接的EMC综合归档平台Centera,作为长期的图像归档,保证数据共享和快速在线访问。
对于医院诊疗中需要长期保存,不可修改的(如影像波形检验结果等)“固定内容”数据,要存储的数据量很大而且在不断增多,EMC Centera对此提供长期存储平台。Centera采用独一无二的内容寻址存储(CAS)技术。为了确保内容的完整可靠,Centera 为每个存储对象指定一个唯一的内容地址。这个地址是由内容本身衍生而来的,同一内容绝不会重复保存。
为了保证长期存储的可靠性,Centera采用的是基于磁盘的独立节点冗余阵列(RAIN)技术。它不同于传统的经常发生物理衰减或磨损的磁带和光盘等存储技术,系统设备全部为冗余设计, 没有单点故障。通过灵活地增加节点,在不中断系统运行情况下持续地提供从目前TB到未来至少PB海量的无中断扩容能力,实现了医疗影像数据长期保存时的“不可损坏性”。
青岛大学医学院附属医院项目负责人徐浩主任说:“应用EMC的Centera作为数据集中归档存储方案之后,院方实现了PACS系统医疗影像信息的长期安全可靠保存和集中化管理。”