对象存储:这是怎么回事?

对象存储:这是怎么回事?

传统上,Web应用程序使用文件系统和数据库将用户数据存储在后端。很简单,结构化数据进入数据库,其他所有数据进入文件系统。这很容易管理,因为很少有应用程序生成非结构化数据-大多数应用程序以表单形式输入用户并将数据保存到数据库中。但是,随着社交媒体,云存储,数据分析平台和其他计算范式的出现,时代正在改变,现在越来越多的非结构化数据被推到Internet上。

的背景

IDC于2014年进行了一项研究,预测全世界创建和复制的非结构化数据将达到44 ZB,即到2020年每年达到44万亿GB。这意味着比2013年的4.4 ZB增长10倍。如果您认为这有点过多,请考虑一下-非结构化数据已经占2015年所有数字数据的90%!


1_py31Qp663cvz0UlaTDyugQ.png


因此,与其他计算范例一样,存储系统需要发展,以适应冲击互联网的新一波非结构化数据浪潮。但是在进一步进行之前,让我为您定义非结构化数据。不能组织起来存储在关系数据库内部的数据通常被称为非结构化数据。您可以具有文本或非文本非结构化数据。文本文档,电子邮件,演示文稿等是文本非结构化数据的示例。非文本非结构化数据的示例包括视频,图像,音频文件等。

为什么要存储对象?

现在我们知道,正在生成大量非结构化数据,需要以易于访问但又安全可靠的方式对其进行处理。自现代计算开始以来,我们已经有了人们一直在使用的存储机制,即文件系统。那么,为什么我们需要一个全新的存储范例?答案在于细节。让我们结束一点,了解要求。

  • 当我们谈论非结构化数据及其规模时,重要的是要了解用于存储数据的基础系统应该很好地扩展。但是扩展文件系统很困难。不仅您需要管理(有时)文件系统强加给您的不必要的元数据和层次结构,还需要处理备份管理等其他内容。

  • 仅收集非结构化数据是不够的。您还需要应用某种级别的组织才能理解数据。文本分析,自动分类,自动标记等技术对于从您收集的所有非结构化数据中获得业务意义至关重要。具有固定布局的文件系统使其难以实现。

  • 文件系统不是用于HTTP(S)的,而是用于人类的。共享和管理文件系统中的文件很难以编程方式进行处理(想想我们大多数人都难以理解的C / C ++文件处理技巧)。处理文件流和可能的边界情况容易出错,并且需要大量时间和精力。

要绕过所有这些,需要一些新的东西。从头开始想象,始终将新的需求作为重点。这导致对象存储。

对象存储

与文件系统中的文件不同,对象以平面结构存储。只有一个对象池-没有文件夹,目录或层次结构。您只需提供对象ID即可请求给定对象。对象可能位于本地,也可能位于数千英里之外的云服务器上,但是由于它们位于平坦的地址空间中,因此可以完全相同的方式检索它们。

另一个重要方面是元数据处理。对象存储在存储对象元数据时提供了很大的灵活性。这意味着元数据不仅限于存储系统认为重要的内容(考虑文件系统中固定的元数据)。您可以手动添加任何类型或数量的元数据。例如,您可以分配元数据,例如与对象关联的应用程序的类型。应用程序的重要性;您要分配给对象的数据保护级别;是否要将此对象复制到另一个站点或多个站点;何时将该对象移动到不同的存储层或不同的地理位置;何时删除该对象。依此类推,可能性是无限的。

通过HTTP(S)访问文件非常重要。仅当文件易于访问时,才可以对其进行分析或其他技术。对象存储处理得很好。几乎所有提供对象存储的平台都提供了REST API,可帮助您通过HTTP(S)访问文件。这些API不仅在访问数据方面有帮助,而且还可以帮助您进行身份验证,获取文件属性和管理权限-您在文件系统中需要手动执行的所有操作。

结论

既然Internet上的大多数数据都是非结构化的,而且专家预测这种趋势将以两位数的速度增长,因此应对这一挑战非常重要。不仅可以以易于访问的方式存储非结构化数据,而且重要的是能够根据随时间推移收集的非结构化数据使业务有意义。

对象存储有望帮助您实现所有这些以及更多。借助HTTP(S)访问,灵活的元数据和平面存储模型,它具有处理非结构化数据浪潮所需的一切。

首先,机会本身就是挑战。只有对挑战有解决方案,它才会成为您的机会。对象存储范例是您应对非结构化数据挑战的解决方案。去把这个挑战变成机会!


上一篇 下一篇