由于企业旨在克服大规模存储、移动和激活数据的成本和复杂性,他们应该寻求更好的经济性、更少的摩擦和更简单的体验。
数据分析、人工智能和物联网正在推动企业数据空前增长。事实上,根据“重新思考数据:将更多的业务数据投入工作”,预计未来一年企业数据将以 42.2% 的年增长率增长,只有 32% 的企业可用数据用于工作— IDC 进行的《从边缘到云》的报告。剩下的 68% 去杠杆化。随着数据量呈指数级增长,数据的积累产生了数据引力。
什么是数据引力?它是数据和应用程序相互吸引的能力,类似于两个或多个物体在万有引力定律下如何相互吸引。随着企业数据集的增长,它们变得停滞不前,业务流程和软件围绕它增长,从而吸引了更多数据。一般来说,数据引力是数据量和激活程度的结果。根据最近的 IDC 白皮书《面向未来的存储:跨混合、边缘和云生态系统的数据增长的现代化基础设施》,“存储数据量最大的工作负载在其‘宇宙’中表现出最大的质量,吸引了应用程序、服务和其他基础设施资源进入他们的轨道。”
数据引力的业务挑战
数据引力影响整个 IT 基础设施;在规划数据管理策略时,它应该是一个主要考虑因素。数据现在是每个垂直领域企业的重要资产。未来几年,结构化和非结构化数据的增长将继续以前所未有的速度增长。与此同时,数据蔓延——业务数据分散在数据中心和地域的程度越来越高——增加了管理数据增长、移动和激活挑战的复杂性。
对 TB 有效的方法可能对 PB 无效。由于企业旨在克服大规模存储、移动和激活数据的成本和复杂性,他们应该寻求更好的经济性、更少的摩擦和更简单的体验——简单、开放、无限,并为数据驱动的分布式企业而构建.
管理海量数据集需要什么?
根据 Future-Proofing Storage 报告,随着与海量数据集相关的存储持续增长,它对 IT 世界中其他元素的引力也在增加。考虑两个数据集:一个是 1 PB,另一个是 1 GB。为了整合这两个集合,将较小的数据集移动到较大数据集的位置更有效。由于大型数据集会“吸引”其他较小的数据集、服务和应用程序,因此大型数据库倾向于积累数据,从而进一步增加其整体数据重力。反映数据生命周期动态,数据重力有助于为 IT 架构决策提供信息。
数据集增长得越庞大,就越难利用该数据,除非它靠近有助于管理或激活数据的应用程序和服务。因此,应用程序和服务通常靠近数据集移动或保持在数据集附近。
但如此庞大的数据集会将存储的数据、应用程序和服务困在一个位置,形成数据“黑洞”,导致数据难以使用。从数据中心到公共云和边缘计算,数据引力是一种跨越整个 IT 基础设施的属性。IDC 分析师建议,没有任何单一数据集会对 IT 和应用程序生态系统的其余部分施加不可控制的力量。
确保应用程序可以访问数据,无论位置如何
减轻数据引力影响的一种方法是确保存储的数据与应用程序位于同一位置,而不管位置如何。这种模式可以通过利用协同定位的数据中心来实现,这些数据中心汇集了多个私有和公共云服务提供商,允许企业将其海量数据存储与应用、计算和网络需求的最佳解决方案配对。通过优化数据位置,以数据为中心的架构使应用程序、服务和用户交互更接近数据所在的位置,而不是依赖于耗时且通常成本高昂的海量数据与集中式服务提供商之间的长距离传输。
在您的 IT 战略中集中数据
将数据置于 IT 架构的中心可以对应用程序性能优化、传输延迟问题、访问和出口费用以及安全性和合规性需求产生积极影响。数据的整体可靠性和持久性也是一个重要的关注点。规划以数据为中心的工作负载和作业意味着要考虑数据引力。此类评估的关键参数包括生成/使用的数据量;跨数据中心、私有云和公共云、边缘设备和远程/分支机构的数据分布;和传输数据的速度。解决这些问题将提高数据基础设施的效率,并可以显着减少代价高昂的数据管道问题。因为数据有引力,
企业必须实施一项战略,以有效管理跨云、边缘和端点环境的海量数据。在大规模设计数据存储基础设施时,制定全面的以数据为中心的战略至关重要。每个数据管理系统都可以更改以适应新的数据需求,这一点很重要。数据管理和支持它的数据架构必须是敏捷的,并且能够适应不断变化的业务需求和新兴的技术机遇——包括那些由数据引力带来的机遇。