使用 Snowflake 查询您在任何位置的数据,无需将其移动或存储在 Snowflake 上。
从 2022 年 6 月中旬发布的 Snowflake 版本开始,支持多云。
使用 Snowflake 数据云查询和分析驻留在 MinIO 上的多个数据源。现在,企业可以访问 Snowflake 数据库,无论它们存在于何处——在公有云、私有云中,甚至设置流式边缘实例。这包括 AWS、GCP、Azure、Tanzu、OpenShift、HPE Ezmeral、SUSE Rancher,当然还有传统的裸机部署。
使用外部表,企业可以享受 Snowflake 的全部功能,而无需承担将数据移动到 Snowflake 数据云的成本。它还使企业能够利用多租户数据或对出于合规性或其他业务原因无法移动的数据执行分析。
只需使用标准 Snowflake CLI(SnowSQL)命令进行查询即可。
在消除所有经济或技术限制后,企业可以在其所有数据上释放 Snowflake 数据云的功能——无论数据驻留在何处。此外,借助 MinIO 业界领先的性能特性,查询可以针对海量的、多 PB 的数据存储运行并快速完成。
这意味着更好地利用 Snowflake 和企业的全部数据。
为了确保正确的数据可供正确的用户使用,必须对这些多云数据湖实施细粒度的访问控制。
对于授权,MinIO 与第三方 IDP 集成的能力确保只有需要的人员才能访问对象存储。为了验证这些用户只能访问他们所需的特定资源,MinIO 先进的基于策略的访问控制 (PBAC) 功能确保这不是事后才考虑的问题。
Snowflake 是企业中一项关键任务应用程序。这意味着 Snowflake 架构需要构建为具备弹性和高可用性。这种弹性不仅需要考虑云区域故障,还需要考虑整个云故障。
MinIO 的主动-主动、多站点、严格一致的复制提供了维持完整云故障的框架,而 Snowflake 在 GCP、Azure 和 AWS 中运行的能力提供了类似的功能。
通过添加外部表功能,现在企业可以设置流式管道,将数据持久化到 MinIO 上——在云端或本地。Snowflake 可以配置为实时执行对这些数据进行查询,从而为 Snowflake 体验添加了一个关键的新维度。