五个分层要点
在后视镜中放有另一个Strata后,该反思一下本周我们所见所闻。在这一点上,Strata显然是数据科学的展示,但是数据科学是广泛的话题。作为高性能对象存储的提供者,我们的观点得到了相应的构架,与单个算法相比,我们更加关注数据堆栈。
以下是数据选取框事件的五个要点:
Cloudera可能认为Hadoop还没有死,但是他们的产品路线图却表明并非如此。哲学上的立场已经让位于实用的位置,而Cloudera则将与存储和计算托管在一起的行李与其他传统实现(如YARN)一起丢弃。虽然令人钦佩,但为时已晚。与大型企业进行的每次对话都包含使用对象存储代替Hadoop的可行性。MapR并没有提供帮助-那些客户与其剩余的员工一样快地奔跑。
人们仍在尽力解决与超高性能对象存储相关的可能性。数据团队第一次看到我们的NVMe编号时,就会感到震惊。能够以每秒40GB / s的速度读/写的能力是一种合法的游戏规则改变者-它将Spark,Presto,TensorFlow和H2O.ai带入了对象存储世界。以前从未做过这-不是因为不需要,而是因为传统的,面向设备的对象存储不可能做到这一点。
Kubernetes赢了。每个人都在谈论引入,整合或实施这种变革性方法。如果您不是,那是因为您做不到,这意味着您已过时。尽管Kubernetes受到了所有媒体的关注,但事实是,微服务堆栈的快速发展同样重要,甚至更为重要。在对象存储方面,Kubernetes领域有四个主要参与者:亚马逊,谷歌,微软和MinIO。只需询问VMware。
Presto正在上升。尽管Spark仍然是领先的数据处理框架,但鉴于Presto在SQL查询上的速度,越来越多的与会者正在谈论和询问Presto。这是因为SQL仍然是数据科学的通用语言,并且在其流行中复苏。这对于其他利用SQL的面向MPP的方法(例如Vertica,Greenplum,Teradata和Splunk)来说是一个好兆头。
开源是企业的一大优势。这与成本(总成本或其他成本)无关,与规模和弹性无关。强大的开源软件项目具有卓越的影响力,这意味着它们可以通过部署得到加强-从规模到安全。鉴于有这么多不同的参赛作品,我们很荣幸获得最有意义的开源项目奖。这说明了我们的规模,我们的社区和日益增长的认识,即最好的软件是真正开放的,而不是薄薄的专有许可证。
对于我们公司而言,这是激动人心的时刻,我们在Strata的接待对我们而言真的很重要。聘请我们的人员和公司数量大大超过了旧金山,而运行MinIO的公司数量已经达到我们不科学的估计-至少高出50%。
如果您还没有成为运动的一部分,请立即加入。您可以下载代码,加入我们的Slack频道,也可以通过sales@minio.org.cn与我们联系。在高性能,私有云对象存储方面,我们将以此为赢,这意味着您将获得成功,因此在构建私有云时,不要害羞与我们合作。