时事通讯




Azure Purview,微软的下一代数据治理


Microsoft在很大程度上已经将数据治理的工具与其生态系统的独立软件提供商(ISP)和合作伙伴留下了留下的数据治理。(完整披露 - 我受雇于销售该Spear-S1 Doc中的产品的ISP。)Microsoft已经提出了多年来的一些功能集,包括主数据服务和数据质量服务,以及最近,最近,最近,最近Azure数据分类功能集。

数据治理挑战

DBA和数据管理团新利游戏队长期以来一直在努力支持数据治理功能。自然而然,一个良好的组织想要从他们的数据资产中提取最大值。但对于没有集成的自上而下数据架构的多年或几十年来创建数据资产的公司非常困难。

随着这些数据管理系新利游戏统的有机增长以及新的数据管理系统的添加,企业数据资源的用户面临着各种各样的挑战:到哪里找到他们需要的数据?如何连接到数据?如何分析和解释数据,尤其是在元数据和文档有限或不可用的情况下?那些为企业提供数据的人也面临相关的挑战,比如为企业数据创建文档和提供安全保障。而且,如前所述,负责管理和保护数据的dba面临着从存储和共享数据到数据发现和公司安全性和遵从性的无尽挑战。

Azure Purview能为你做什么?

虽然微软早期用于主数据管理和数据质量的特性集提供了一些帮助,但微软现在提供了Azure Purview的预览新利游戏版。Azure Purview是一个统一的SaaS数据治理工具包,旨在与本地、云甚至其他SaaS数据平台协同工作。Purview使您能够发现组织中的数据资产,构建这些资产的映射,并根据数据的敏感性对数据进行分类,以及构建数据沿线映射。

您可以在PURVIEW中找到一些主要工具:数据映射,数据目录和PURView Studio。首先,数据映射是一个云本机PaaS工具,从运行数据库到数据湖泊和分析系统,从各种组织数据源捕获元数据。创建后,数据映射使用自动扫描自动保持最新。反过来,数据映射为数据目录工具提供支持,并在PURView Studio中提供见解。

您可以扫描各种各样的Azure数据源(如Azure SQL DB、Azure Blob Storage、Azure data Lakes和Azure Cosmos DB)和大量不同的结构化文件格式(JSON、Parquet、CSV、XML等等)。另外,还可以扫描L1-L3三个级别。

L1扫描主要收集文件名、大小、完全限定名等基本元数据。L2扫描收集数据库表和文件类型的模式。L3扫描提取模式,并应用系统和自定义分类规则。

数据目录使用户能够使用“镜头”(如敏感性标签、分类(GDPR等)、术语表术语等)快速、轻松地查找相关数据。还可以使用Data Catalog在业务术语表管理器中管理数据。从那里,您可以看到数据起源的可视化表示,比如从操作数据库,通过ETL流程,再到Power BI或Azure Machine Learning等可视化和数据科学平台。

不仅仅是dba

虽然Azure Purview对任何数据管理专业人员(如DBA)都非常新利游戏有益,但它对数据管理员、安全官员和合规官员也非常有用。事实上,任何想从自上而下的、具有分析功能的企业级数据地图中受益的人都会发现这是一个非常有用的工具。

您首先注册一个或多个数据源。然后,PURVIEW副本和索引数据源的位置信息和元数据。您可以进一步注释数据映射信息,添加说明,标签等。创建后,您可以使用PURView Studio浏览数据谱系,查询数据源之间的关系,并进行各种其他有用的活动。

下一个步骤

你可以在https://docs.microsoft.com/en-us/azure/purview/overview#next-steps上阅读更多关于Azure Purview的预览。您可以在下面阅读Azure Purview文档https://docs.micro.soft.com/en-us/azure/purview.还有一个工具包中每个工具的入门套件和教程。定价仍有待确定。

首先创建一个Azure帐户,在这个帐户中您拥有一个Azure Active Directory租户。您还需要在Azure帐户中创建资源的权限,因为Purview需要创建一个托管的资源组、一个从属的存储帐户和EventHub名称空间。n