菜单

目录

Administrator
发布于 2023-05-23 / 3 阅读 / 0 评论 / 0 点赞

数据质量管理


基础知识

质量管理(PDCA)

  1. P:计划

  2. D:执行

  3. C:检查

  4. A:处理

目的

提高数据质量

质量规则类型

  1. 强制类型

    • 数据元编码

    • 数据元长度

    • 数据元类型

    • 数据值格式

  2. 宽松类型

    • 空值

    • 值域

    • 取值范围

    • 数据项逻辑

功能

质量扣分规则

  1. 配置表

    • p_b_codevalue

    • basecodetablecode:2016

    • 扣分值:specialtype

  2. 质量扣分配置

质量规则定义

  1. 自动质量规则

  2. 自定义

质量数据收集

质量分析服务

质量报告

质量服务

质量管理实施方法

配置阶段

前置条件

完成数据标准化的定义

数据标化

  • 系统自动化处理的

    • 标识

    • 类型

    • 主键、外键空值配置

  • 人工处理的

    • 名称(数据元字段名)配置

    • 空值配置

    • 值域代码配置

质量规则配置

  • 扣分规则的定义

  • 数据项的扣分规则定义

交换阶段

控制不符合数据标化的数据不能接入平台

分析阶段

根据质量规则形成质量分析数据

报告阶段

生成质量分析报告

练习

  1. 确定一个质量分析的场景

  2. 确定要做质量规则的数据类别(字段)

  3. 设计这些数据类别(字段)质量规则

  4. 在平台中固化质量规则

  5. 发布消息,让某些数据不满足质量规范

  6. 查看质量报告