新闻稿




数据建模在大数据世界中的重要性


随着更多组织拥抱大数据和分析来获得极大的数据集的洞察力,用于管理数据的工具和系统已经生长,更改,乘以。我们现在使用NoSQL数据库和Hadoop文件系统使用NoSQL数据库和Hadoop文件系统来存储越来越大量的企业数据。

You would think that with the towering importance of data in today’s modern organization that data modeling would be viewed as extremely important by management and IT professionals, so it is somewhat ironic that the age of big data has coincided with a long-term slide in data administration and modeling in many organizations. This is not a situation that should continue to be tolerated.

什么是数据建模?

数据建模是分析您组织感兴趣的“事物”以及这些事物如何彼此相关的过程。数据建模过程导致对业务数据资源的发现和文档。当您创建概念和逻辑数据模型时,您正在开发组织业务的Lexicon。

使用作为现实世界的抽象的组件构建数据模型。最简单的数据模型包括实体和关系。随着数据模型的研究进展,添加了额外的细节和复杂性,包括属性,域,约束,密钥,基数,要求,关系 - 重要的,重要的是,数据模型中的所有内容的定义。如果我们想了解我们所拥有的数据,以及如何使用IT-A-A的基础型号。

大数据的问题

大数据和分析是现代IT的重要组成部分。分析师估计我们使用和管理每年使用和管理的数据量并对该数据进行分析,可以揭示迄今为止未知的洞察力,导致竞争优势。此外,用于电力分析的大数据适用于AI和机器学习软件,通过自动化过程和任务,从而提高生产率和操作效率,进一步改善我们计算投资的回报。

但是,当使用诸如NoSQL和Hadoop等灵活的架构技术时,可能会出现问题。这种灵活性通常是在被发现,摄取和移动到组织中的大量数据时的要求。当数据的一行(或记录)可以具有与下一步不同的架构时,您无法将固定模型应用于数据。

然而,程序员必须知道数据的样子。你不能只是在某人身上抛出大量数据,并说:“这是数据,现在给我写了一个节目。”嗯,你可以这么说,但是程序员(或某人)必须分析和记录数据的结构。

嗯,这听起来很像数据模型,不是吗?好吧,应该,因为它是。在写入任何代码之前,在任何代码之前,在关系世界中常见,有时基于程序代码或工具中的应用程序查询执行大数据建模。我们要避免的是,在20世纪80年代在关系之前,在关系中嵌入了应用程序中的数据的所有知识。我们应该尽量避免需要开发人员每次使用时都会重新模拟相同的数据。数据建模创建了一个可通过所有人访问的企业数据的记录系统,而不仅仅是那些了解编程语言du Jour的人。

为什么仍然需要数据建模

如果我没有相信你的数据建模仍然很重要,那么考虑法规遵守的影响,这是您的组织确保它遵守政府法律和适用行业法规的必要流程和程序。

这包括HIPAA,PCI-DS和GDPR等法规。这些以及许多其他规则指定了必须以各种方式保护或控制的数据的类型和实例。如果没有数据模型,可以识别和定义您所拥有的数据(包括它来自哪里以及使用它),您如何希望符合适用于您业务的所有法规?

开始今天

如果您今天没有模型并定义组织的数据,您始终可以在按项目的基础上开始这样做。将数据文档作为您开始的每个新项目的组件。教育您的开发团队有关数据建模和适当文件的重要性。并确保每个项目前进的每个项目都需要数据模型。使用此方法随着时间的推移,您可以将数据建模构建到组织的结构中。