论坛 产品库 视频 专题 CIO俱乐部 Windows8 实验室 CMO俱乐部 案例

中国惠普张梅生:大数据时代的数据保护

发布时间:2012-11-28 16:00:00 来源:比特网 作者:李群
关键字:CIO年会 cio 惠普 信息化

  比特网(ChinaByte)11月28日消息 由中国计算机用户协会、中国互联网协会指导、比特网和IT专家网主办、比特CIO俱乐部承办的第五届中国CIO年会,在国家会议中心隆重开幕。本次年会主题定位新技术浪潮下的IT变革。聚焦热点技术,关注企业应用,引领IT变革。

  在今日下午的大数据专题论坛上,中国惠普有限公司存储产品部产品经理张梅生现场发表题为“大数据时代的数据保护”的演讲。她指出,大数据有公认的三大特征:数据量大、多样性和流动性。

  张梅生认为,解决大数据问题的关键点在于解决方案,而出发点在于成本。她表示:“因为数据量激增太快,如果不能有效的节制成本投入IT设施的建设,以后要去花费的东西可能是大家不能承受的。所以在这种大数据的应用,对存储,对新一代的存储产生了非常重大的影响,从而还引发了存储的架构的变革或叫改革,现在正处于存储变革的时代。”

  以下为张梅生现场发言实录:

  张梅生:刚才各位专家和领导讨论了大数据时代下的面临问题和主要挑战和未来的需求。我开始的议程从另外一个角度,你对大数据来讲,你数据的价值和数据怎么样安全的、有效的保护起来,而且还是以低成本的方式帮助你实现数据价值的分析和保留。我叫张梅生,来自中国惠普公司做备份的基线产品的产品经理,今天想跟大家讨论一下在大数据时代下的信息如何去有效低成本的保护起来。

  大数据时代,我们现在提得很多了,对于数据来讲,在大数据有哪些特征呢?大家都比较认可的还是有三个V,第一个就是数据量大,咱们怎么能够从这个能体现出来,IDC的调查说,在2010年之后,平均每年企业的速度以高达40%的速度在增长,你可以想而之,这个数据对于用户,对我们的客户来讲,这会带来这么大的压力。

  第二个特征,多样性,大家都知道,在20年前,我们如果 企业花一笔钱保护数据,基本上你再去投入这个项目的设计,研发阶段,已经可以知道,一般会保护什么数据,结构化数据,关键数据都是存在数据库里面,但是在大数据时代,我们的数据有大量的非结构化数据或者混合型的数据产生,我们有更多的数据采集的方式,像刚才听统计局领导在讲说,统计方式有可能来自于企业直接从移动的后端上,把数据收上来,给大数据的数据类型带来非常新型的挑战,在这种环境下,你怎么把它数据从各种来源,各种不同位置,不同设备上的数据能够有效的保存起来,这也是大数据下非常大的特征。

  第三个就是流动性,流动性比较容易理解,我们的数据以前都是在数据中心,运用到数据库里面存放,大量的数据,保护的数据,都在数据中心,但是我们有大量的分支机构的数据遍布在世界各地。我们基于在传统的物理环境之外,我们还有新的虚拟化环境,又产生了非常多的数据,当我们大量的应用,这些都带来了整个大数据是流动的方式,来体现出来。所以对大数据技术的价值,你怎么样有效的获取信息的价值,并把它加以分析,这就是大数据的技术。

  在中国来看,我们从政府来讲或者从行业来讲,大数据话题怎么来看呢?可以看到,工信部发布的物联网“十二五”规划把信息处理技术作为四项关键技术创新工程了,有感知、传输、安全技术相关的。数据激增,平均以40%的速度企业速度不断增加,根据一个统计来讲,企业有80%的数据存在远程计算机,给传统的IT基础设施,发生在非结构化的数据占到80%以上,数据增长的速度高达45%到55%。我们可以看到一个统计,过去七年的统计里面,我们在线的数据增长了56倍,后面还有一张图看到指数级的增长,从计算机方式上以什么来计算的。所以你现在可以看到,在大数据的环境下,归档的解决方案已经成为存储管理软件非常活跃的部分,而且从现在到2015年都会保持22%的增长率。

  这种大数据时代下,对于我们IT的存储管理,原来讲,你可能面临到了你要处理以前从来没有面对过的这么庞大的问题,以前没有办法想象的数据,我们看一下,这是什么级别呢?我们可能在20年前的时候,数据还是这样来算,惠普服务器里面自带了磁带机,磁带机备份的数据量远远高于存储,当时以GB来算,现在来看,我们存储已经到TB了,未来有ZB、YB,我们会看到将会面临数据多么膨胀的年代,在这种数据膨胀的年代下,怎么构建新一代的IT基础设施,构建一代存储架构,新一代数据解决方案,是我们IT人要思考的问题。

  作为数据来讲,每个数据都有生命周期,数据从它开始被创建到访问,然后处理、保护,一直到数据过期,我们不它删除掉。所以在处理数据的生命周期的时候,每一代管理员提问最多的五个问题是什么呢?第一个,肯定是我怎么样能够精力高效访问到这个数据,只有你访问到了数据,才有可能得到这个数据的价值被你利用。第二个,怎么样在庞大的数据里面可以有效的组织处理这些数据。第三个,是最基本的数据保护的防线,怎么备份你的数据。第四个,你过期的数据如何快速有效清除掉。从成本的角度,我们更关注我们的便利,机房空间的限制怎么去解决,这是每个管理员都会提问比较多的五个问题。

  在处理数据积分的问题的时候,大家可以想一想,有没有建立有效的信息管理的岗位或者有没有专门的职位、部门或者相应的规范,数据来讲,是不是所有的数据都要被全部保留,为什么?这些数据会被反复地使用呢?还是多久存储一次?如何使用监管和保留的要求是否更新?有没有实时的进程访问,可以了解到以前的一些数据要求。

  接下来,我们要考虑把它存在哪里,经常需要访问的数据,把它存在同一个地方,赋予同样的性能和资源,大家心里都会有一个答案。所以在这种存储成本,不断下降的时候,我们的IT依然要耗费大量的资金。举一个例子,从1994年的时候,大概250美金可以买到2GB的存储,到了2009年的时候,250美金可以买到200G存储,你可以从这个数字里面可以看到,实际我们平均每GB磁盘的成本一直在下降下降很,成本很低,但是作为IT信息管理人员,有没有想过,你们真正在存储中的有没有下降这么多呢?没有,我肯定在存储投入更大。


猜你喜欢

-->
比特微信账号
比特微信账号

微信扫一扫
关注Chinabyte

返回首页 长微博 返回顶部