数据质量管理基础
作者: (英)樊文飞,(英)吉尔茨 著,刘瑞虹,贾西贝 译
出版社:国防工业出版社 2016年1月
简介: 数据质量是数据管理中极其重要的一个方面。现 有数据库系统通常可支持大规模数据的创建、维护、 使用。侧重于数据的“量”的管理。但真实世界中的 数据通常是“脏”的。常见问题包括数据不一致、重 复、不**、不完整或时效性不强。数据库中的问题 数据则带来诸多后果,例如:产生误导性或偏向性的 分析结果与决策制定,以及效益、信誉以及客户的损 失等。因而,数据质量管理可谓当务之急。与传统的 数据管理任务不同。数据质量管理在语法和语义方面 对数据错误进行检测并修正,以增强数据质量,进而 为商业过程增值。本书概述了数据质量的5个核心问 题,即数据一致性、数据去重、数据**性、数据时 效性及信息完整性,提出了一个统一的基于数据质量 规则的逻辑框架来解决上述问题。 樊文飞、弗洛里斯·吉尔茨编*的《数据质量管 理基础》适合作为研究生教材,也可供数据质量管理 领域的研究者与实践者参考。