

01 数据治理体系
数据治理体系内容从两个维度来看:
1)数据治理难点痛点:数据脉络不清晰、数据汇聚能力不足、数据管控能力薄弱、数据治理体系不完善、开放形式不完善。
2)数据治理5个核心:理、聚、管、治、用。
数据治理体系主要包含内容有数据标准、元数据、数据建模、数据集成、数据生命周期、数据质量、数据开放、数据安全及数据应用。
02 元数据
2.1、元数据解决的问题
2.2、元数据分类
2.3、元数据模型成熟度
1、第一阶段:需要手动管理元数据,即在数据治理流程外需要额外增加的步骤。
2、第二阶段:在数据探查阶段自动生成元数据。
3、第三阶段:自动构建数据流转元数据。
2.4、元数据建设目标和管理手段
2.5元数据管理
元数据管理方法:
元数据管理能力:
03 数据标准
常见的数据标准包含基础数据标准和指标数据标准。
主要构成:业务定义+管理信息+技术属性
数据标准包含内容包括:主题&分类+标注属性+标准代码
3.2.2、数据标准类型(举例)
不同行业的标准不同,这里仅是举例说明。
如:性别、身份证、金额、手机号码、行业、级别的分级分类的代码等
3.3、数据标准管理体系涉及思路
数据标准来源于业务,服务于业务。
依据已有标准进行建设
3.4、数据标准架构体系
3.5、管理类数据标准建设原则
定义:分析类数据标准的业务含义和所适用的业务场景保持一致。
口径:分析类数据标准的业务取值范围、计算方法和编码规则等业务规则保持一直。
名称:分析类数据标准中文名称和英文名称均采用统一命名规则,表示相同业务含义的信息项名称应保持一直。
参照:各分析类数据标准项标准化时参考的外部标准(包括国际标准、国家标准和行业标准),内部业务制度和业务规范应保持一致。
来源:每个分析类数据标准都应有权威的来源系统;其他系统使用该信息时应直接取用权威系统结果,以保持一致。
以下为某企业数据标准体系框架示例,分为基础类数据标准和管理类数据标准
3.6、数据标准生命周期管理
04 数据建模
4.1、概念
4.2、数据模型分类
4.3、数据模型生命周期
4.4、案例
05 数据集成
5.1、概念
5.2、数据集成整体架构
06 数据生命周期
6.1、阶段划分
按照两个大的阶段来划分:数据治理规划阶段+数据生命周期管理阶段
-
业务规划定义阶段:业务规划、业务标准设计
-
应用设计实现阶段:数据模型设计、应用标准设计、应用设计实现、数据录入
-
数据创建:利用数据模型保证数据完整、执行数据标准保证数据准确、加入数据质量检查创建准确、保证数据在合理的系统生成;
-
数据使用:利用元数据监控数据使用、利用数据标准保证数据准确、利用数据质量检查加工准确、确保数据在合理的系统使用、控制数据的派生;
-
数据归档:利用评估手段保证归档时机、分数据类型规档数据;
-
数据销毁:利用评估手段保证数据销毁时机,分数据类型销毁数据。
-
满足对历史数据查询相关政策和管理制度的要求
-
满足业务操作和管理分析的需要
-
满足审计管理要求
-
减少数据冗余,提高数据一致性
-
存储、硬件、运维等方面基础设施投入
-
提升应用系统性能,提高响应速度
6.2、管理要求和手段
6.3、管理规范和管理办法
07 数据质量
7.1、数据质量管理目标
-
根据数据消费者的需求,开发一种满足数据质量要求的管理方法 -
定义数据质量控制的标准和规范,并作文整个数据生命周期的一部分 -
定义和事实测量、监控和报告数据质量水平的过程 -
根据数据消费者要求,通过改变流程和系统,以及参与可显著改善数据质量的活动,识别和倡导提高数据质量的机会
7.2、生命周期
-
计划阶段:数据质量团队评估已知的问题范围、影响和优先级,并评估解决这些问题的备选方案。 -
执行计划:数据质量团队负责努力解决引起问题的根本原因,并做出对持续监控数据的计划(技术问题、流程问题)。 -
检查阶段:这一阶段包括积极监控按要求评测的数据质量。 -
处理阶段:处理和解决新出现的数据质量问题的活动。
7.3、数据质量维度
详见:数据质量管理之根因分析!
7.4、数据质量常用工具
08 数据开发
8.1、数据资产
数据资产的应用实现方式,打通基础数据链条,实现联通协同,提升数据价值
数据资产生命周期:注册、变更、监控、下线
8.2、数据服务
数据服务技术架构:
09 数据安全
10 ETL
10.1、含义
10.2、ETL模式
触发器模式:
增量字段模式:
全量同步模式:
日志对比模式:
不同模式的对比:
详见:ETL与数仓建模!
10.3、离线和实时
离线数据:
使用场景: