在第 1 部分和第 2 部分在本系列文章中,我们描述了 避免数据仓库和 BI 项目中的这 数据仓库 (DW) 和商业智能 (BI) 项目如何成为许多组织的首要任务。项目发起人寻求在整个企业中实现更多、更好的数据驱动决策和行动;他们打算扩大 BI、分析和数据发现的用户群,以便用户做出明智的决策。
这一系列要避免的错误主要是为了帮助组织避免 避免数据仓库和 BI 项目中的这 在 DW 项目中遇到的数据质量问题。这里提供的提示将有助于确保 DW 团队在规划和实施新功能和新能力时获得满意的结果。
下面列出了各类从业者所经历的更多错误
DW 项目充满挑战 — 从仓库中的数据质量到 BI 报 电话号码资源 告中的派生值。如果不及时解决,数据质量差(尤其是在数据仓库中)可能会导致整个项目停滞。
数据仓库由于缺乏数据质量研究表明,在将数据从源移动到数据仓 你进 前端测试手册:定义、类型、资源、清单等 行研究的 库和数据库的各个区域时,数据质量通常会下降。在开始加载源时以及在清理、转换、聚合和集成数据到数据仓库的每个步骤中,都应进行全面的数据质量评估。
依靠 BI 报告测试来发现数据仓库中的缺陷
等到 BI 或分析报告可用后再进行大多数项目数据质量测试(数据转换、重复数 任 线数据库 何数 据、缺失数据、空值、业务规则的应用等)可能会导致冗长而复杂的缺陷故障排除,而这些缺陷本来可以以较低的成本及早发现和修复。
以下是多项研究确定的五个 DW 数据问题,这些问题最有可能发生,并且对项目成功有直接影响。请注意,这些风险中很少有与 BI 报告中的缺陷相关的。