微软发布了Azure Purview,这是一个公开预览的新数据治理解决方案。另外,该公司宣布Azure Synapse Analytics现在已普遍可用。
Azure Purview可自动发现数据和编目,同时最大程度地降低合规风险。Purview可帮助企业映射所有数据(无论它们位于何处),并提供其数据仓库的端到端视图。同时,Azure Synapse Analytics利用按需或预配资源来摄取,准备,管理和提供用于商业智能的数据。Azure Synapse Analytics通过将数据仓库,大数据,数据集成和AI集成在一起,改变了企业存储数据和获取见解的方式。
企业越来越多地利用数据作为战略资产,这使得数据服务至关重要。数据不仅需要存储和管理,还需要以不断增长的数量进行发现和分析。微软设计的服务完全可以自己完成任务,因此微软很乐意出售对其的访问权限。
“过去几年,我们与正在经历数字化转型的客户合作时所做的一件事是,要了解'我们需要成为数据的挑战'带来的痛苦在哪里?推动公司发展并建立数据文化,” Azure数据CVP Rohan Kumar告诉VentureBeat。“其中的关键基础要素之一是真正拥有一个数据平台,从本质上讲,您可以通过分解数据孤岛来非常快速地生成见解。”
Azure权限
Purview对来自本地,多云或软件即服务(SaaS)位置的数据进行分类。Purview将使Azure客户准确了解他们拥有的数据,管理其对隐私法规的遵守情况并获得见解。Purview旨在通过了解数据,数据的移动方式以及与谁共享的方式,最大程度地合规使用公司自己的数据。
Kumar说:“此次发布是围绕在物理资产和业务资产中映射整个数据状态目录的。”“因此,对于组织中存在的每个数据资产,都非常了解它是从哪里来的,进行了哪些更改,进行了哪些更改。基于此,您可以围绕可信任的数据制定决策,当您考虑成为数据驱动型组织时,所有这些再次变得非常重要。”
Azure Purview包括三个主要组件:
数据发现,分类和映射:Azure Purview将自动在本地或云中找到组织的所有数据,甚至由其他提供商管理的数据,并评估数据的特征和敏感性。
数据目录:Azure Purview使所有用户都可以使用基于Web的简单体验来搜索受信任的数据。可视图形使用户可以快速查看感兴趣的数据是否来自受信任的来源。
数据治理:Azure Purview提供了公司数据格局的鸟瞰图,使数据官员可以有效地管理数据使用。这可以实现关键见解,例如跨环境的数据分布,数据的移动方式以及敏感数据的存储位置。
微软表示,这些改进将有助于打破传统上复杂而缓慢的数据治理的内部障碍。此外,Purview的路线图包括治理政策,以帮助遵守欧盟的GDPR和加利福尼亚的CCPA。
“不仅仅是为了确保您正在使用最佳的AI和机器学习,” Kumar说。“获得见解,这很棒。但是,如果您在未经客户同意的数据集上进行操作,则可能会遇到严重的麻烦。我们所有行业的客户都知道这一点。这正是Synapse和Purview的结合真正改变了他们的游戏方式。”
Azure Synapse分析
微软于2019年11月推出了Azure Synapse Analytics,承诺将帮助组织使用自己的数据并部署AI。目的是让组织中的任何人都可以访问其分析,从而使熟练的技术人员不必管理数据基础架构。
Azure Synapse可以按“ PB级”查询关系和非关系数据,由SQL行指示。自宣布以来,微软表示运行PB级工作负载的Azure客户数量已增加了五倍。
Kumar说:“我们支持SQL引擎和本地集成的Spark引擎,因为我们看到Spark吸引了数据科学家大量的关注。”“他们需要与数据工程师很好地协作,以在数据集上建立他们的机器学习模型。”
智能工作负载管理,工作负载隔离和无限并发等功能可实时优化查询性能,并且与Power BI和Azure机器学习的深度集成简化了清理和处理后数据的共享。
Kumar说:“ Azure机器学习具有拖放式的经验,您基本上会指向要在其上训练模型的数据。”“您选择在培训中非常重要的属性。而且那里的优势是,一旦您训练了模型,您就可以在Synapse中执行的SQL和Spark查询中自动使用该模型,而无需进行其他工作。”
Azure Synapse Studio提供了用于数据准备,数据管理,数据仓库,大数据和AI任务的工具。此外,它使用户可以在安全访问数据集和自定义控制界面的同时管理数据管道并构建概念证明。在安全性方面,Azure Synapse具有自动威胁检测和始终在线的数据加密功能,并提供了细粒度的访问控制以及列级和行级安全性。
Kumar说,过去一年中有数百家公司采用了Azure Synapse Analytics,其中包括依靠Azure Synapse的FedEx,Procter&Gamble和Wolters Kluwer等主要公司。“它一直是我们在Azure中增长最快的数据服务之一,” Kumar说。“随着客户开始越来越依赖Synapse的分析,我们在客户和使用方面都取得了显着增长。”