易有太极,是生两仪,两仪生四象,四象生八卦,世间万物皆出于此。古人的《易经》用这段话解释万物起源的过程,而我们是如何得知的呢?因为数据的保存流传,数据信息可以看做文明传播的主要载体,而存储介质的使用则是数据信息传播的主要工具。从结绳记事,到甲骨、青铜鼎,再到纸张的使用,人们通过不断的改造发明,将文明传播一代又一代,也改进了人类发展进程。这里有一个反例可以看出存储介质选用的重要性,作为四大文明古国之一的印度就曾出现了较为严重的文化断层,据考古研究他们使用树皮或树叶记录信息,到今天的存世量非常稀少,有学者指出这是导致文化断层的最根本原因。
随着工业革命的发生,科技的日新月异,人们选用的存储介质也发生了较大的变化,硬盘开始成为人们日常生活工作中的必备品,并在数据存储中扮演着重要角色。但是近年来,由于社交网站、智能移动终端的不断普及,人们创造出来的数据量是惊人的,据统计2013年光中国产生的数据总量就已经超过0.8ZB(相当于8亿TB),在海量数据的压力下,数据的存储介质会发生什么改变?企业面对海量数据如何改造升级传统数据中心来满足业务运营的需求?新兴的互联网巨头公司又该如何解决自身庞大数据的存取难题?这些亟待解决的问题是用传统手段,比如无限制扩展数据中心规模,扩充存储容量,还是采用新的科技手段,选择新的存储介质来满足海量数据的存取需求呢?
大数据下的数据取舍
要想解决上面提到的问题,首先我们应该先了解现阶段下海量数据的构成特点。以前的数据存储基本是基于结构化数据进行的,这些数据有一定的规律性,通过简单的机制就可以方便的存储数据并能够随时获取到相关信息。但是随着社交网络以及智能设备的普及,任何一个人都能产生大量数据,而这些数据又杂乱无章,毫无规律可循,这些数据又被被称为非结构化数据。尤其是互联网行业,用户在其平台上所创造的视频、文字、图片更是缺少一定的信息标注,使得早期的数据中心很难区分数据类型,对数据信息采取直接存储的方式,极大降低了数据的可用性,并造成了一定的成本浪费。
在大数据时代,人们开始重新审视数据的可用性以及重要性。由结构化数据和非结构化数据组成的海量数据对于企业的IT建设成本负担占据多大比例?这些数据的可用性对于企业来说是否能够逐渐降低其投入产出比?如果要解决这些问题,首先要从存储其数据的介质开始说起。
传统机械硬盘存储的弊端
我们知道自从硬盘被IBM这蓝色巨人造出来后就一直承担着数据存储的重担,在企业IT基础架构中,硬盘都是搭建IT整体架构的“板砖”。硬盘厂商通过技术更迭、厂商之间的各种收购,现在已经形成了寡头时代,如买了IBM硬盘业务的日立环球存储被西部数据收购,更名HGST,西部数据也因此坐拥硬盘老大地位;由IBM前员工创办的希捷公司,在收购迈拓、三星的硬盘业务后,也稳居硬盘市场第二,硬盘市场竞争激烈程度可见一斑。因为用户的高需求量,才能创造市场的繁荣,份额大了,抢得人就会多,手段就会激烈。
那么这一对硬盘的高需求量在大数据、云计算时代下发生着哪些变化呢?因为传统机械硬盘单碟容量的限制,导致大多数用户在面对海量数据时只能采取不断扩容的手段来满足数据存取的需求。而不断的扩容必然导致设备能耗的增加以及空间资源的浪费,这也使企业陷入了一个“容量无底洞,金钱塞不够”的状况。另外,因为传统机械硬盘的转速、性能方面以及高可靠性等方面的局限,令用户在存取大容量数据时,增加一定的时间成本。再加上现在占据主流的非结构化数据的多样性,让用户不再单单满足于简单的数据存储,而是需要在成千上万次的数据存取过程中去寻找数据价值,这对于一块硬盘的性能有非常高的要求。
新闻资讯
NEWS