使用 Apache Iceberg 和 MinIO 构建 Data Lakehouse
我介绍了 Apache Iceberg 并展示了它如何使用 MinIO 进行存储。
阅读更多...
我介绍了 Apache Iceberg 并展示了它如何使用 MinIO 进行存储。
阅读更多...
Apache Kafka 是领先的开源分布式事件流平台,用于构建数据管道、流分析、数据集成和应用程序。企业喜爱Kafka是因为它的高可用性、高吞吐量和可扩展性。他们还喜欢使用 Apache Spark 来处理数据和构建分析,因为它快速、分布式且具有容错能力
阅读更多...
纠删码是 MinIO 的核心功能。它是为分布式设置提供高可用性的基石之一。简而言之,写入MinIO的对象被分割成多个数据分片(M)。
阅读更多...
使用 MinIO 管理用户、组和策略以确保安全性和功能。
阅读更多...
什么是 ArgoCD?简而言之,它是一个 GitOps 持续部署工具,将基础架构的状态存储在 Git 存储库中,并通过跟踪现有部署配置和新部署配置之间的变化来自动部署。
阅读更多...
Apache Kafka 是一个开源分布式事件流平台,用于构建实时数据管道和流式应用程序。它最初由 LinkedIn 开发,现在由 Apache 软件基金会维护。
阅读更多...
使用 Apache Iceberg、Dremio 和 MinIO 构建本地数据湖
阅读更多...
让我们回顾一些可用于从 S3、本地文件系统、NFS、Azure、GCP、Hitachi Content Platform、Ceph 和其他工具中获取数据并将其放入 MinIO 集群的工具。
阅读更多...
在这篇博文中,我们将构建一个 Notebook,它使用 MinIO 作为 Spark 作业的对象存储来管理 Iceberg 表。
阅读更多...
GitLab 可以使用 MinIO 作为其对象存储后端来存储大型文件,例如工件、Docker 图像和 Git LFS 文件。鉴于合适的底层硬件,MinIO 提供了支持任何现代工作负载(包括 GitLab)的性能和规模。
阅读更多...