第一篇译文:
数据库业界在新的一年迎来什么样的变化?我有三个可靠的预言:一,数据卷会不断增长并且变得更加复杂。二、业务负责人将寻找释放数据价值的新方法。三、数据安全和治理将变得更有挑战,而且代价极高。
为什么我能够对这三个观点如此确认?是因为它们在数据库领域已经存在了25年之久,并且没有什么改变的信号。
这些是我对新一年数据方面预言的基础部分,除此之外还有别的内容。基于过去一年云数据库市场的快速变化和高度创新,我这里有些其他的关键趋势:
- Exabyte 级 数据库将成为主流。为了显示数据库的发展速度,我们从1997年说起,当时 Microsoft 主持了“Scalability Day”,在这里宣传 Windows NT 可以处理 Terabyte 级的数据。今天,许多业务都管理着 Petabytes 级的数据,是当时的一千倍之多。 Exabytes 级将会是下一个目标,意味着24或25年前数据量的一百万倍。“大数据”这个术语已不再足以描述2022年的数据数量。
- “如果数据迁移没能杀死你,那么会让你更强大”。Gartner 预测在2022年底,有75%的数据库将会上云,或在云上创建。这个趋势带来了无尽的数据迁移工作量——需要经历很多不眠之夜来支撑那些关键业务的项目,这个过程甚至需要花费几个月的时间才能完成。云供应商可能会提供数十种工具和服务来协助迁移的过程。
- Snowflake 创造了产业级“风暴”。Snowflake 在全球的数据分析和数据共享产生了举足轻重的影响力,并且这种影响力毫无疑问会继续扩大。公司从过去那种集中式的数据仓库迁移至 Data Cloud,并且帮助数据科学触达更多用户。越来越多的云数据库提供商试着学习 Snowflake,或者成为类似于 Snowflake 之于 AWS,Google Cloud 和 Microsoft 的合作伙伴。
- 数据管理将变得更简单。数据库管理如:分区、分片、列表、join、存储过程和索引等技术已经相当成熟。现在,云数据库通过 Serverless 能力使得数据库供应、管理和扩容变得更加容易,Oracle 的“自驱” 自动化数据库。这也帮助 IT 团队可以聚焦在业务策略上,减少在相关系统的困扰。
- 数据库将永远免费。这些年,数据库服务商提供了基于云数据库的试用版本,通常使用几周或者用光用量后,就需要用户付费。近期,有相当多的供应商如 Cockroach Labs、DataStax 和 Neo4j 开始提供入门级可供长期使用的云数据库,这简化了开发者的起步和原型测试。
- 三大云服务商会成为新的“引力点”。AWS、Google Cloud 和 Microsoft Azure 可能并不是数据库市场的第一名——这仍然属于 Oracle——但是它们有更好的势头。得益于它们提供的各种场景的数据库系统、分析系统、AI/ML 等,这些云服务商领导者正在加速成为云数据库的领导者。
- 不可变对象(传统产品)遇到不可抗力(创新产品)。古老的物理法则可以用来描绘现在的云数据库市场,传统的供应商如 Oracle、Teradata 和 IBM 是无法根除的,而现在如多相对较新的玩家如 Databricks、Couchbase、Firebolt 和 Yellowbrick Data 正在蚕食安装部署的选择。传统的服务商需要不断引入新的服务和发明来更新它们自己的产品。
- 数据分发成为业务活动。中心化的数据管理正在演变为分布式的数据架构,通过如改变数据获取方式、数据传输和分布式数据库等新能力,让数据在跨云、跨地理位置上进行分发。这样的变化带来了机会(靠近客户)也带来了挑战(监管合规),业务主管们开始逐步关注数据的位置。
- CEO 们开始考虑数据货币化。业务领导者知道他们组织聚合和管理的 PB 级数据中蕴含的巨大价值,所以他们在积极寻找一些办法将这些数据资产货币化。Snowflake 提供了数据集市,现已超500个列表并且在不断增长。有一个办法,就有别办法,不是所有的都需要对数据集进行买卖交易。
- 将出现逾800种数据库管理系统。你可能会认为数据库平台的发展速度似乎变慢,这么多数据库会诞生在50年后。但是你错了,在卡耐基梅隆大学的 “Database on Database” 列表中已经囊括了775个数据库管理系统,而且不断有新的数据库被加入,如最近的 Dremio,ShardingSphere,UnumDB,PancakeDB 以及 Mongrel,如果你认为这是一个惊喜,那么云数据库市场将在2022年带来更多的惊喜。
在某些方面,这个列表仅解开了世界数据库大趋势的面纱,还有统一数据库、多云、混合云、数据云、客户数据管理、安全、AI/ML、数据科学等。别眨眼,不然你可能就错过了这次的机会。这不是预言,这是云数据库市场正在发生的事情。