原文来源公众号:优享智库
目 录
1. 范围 1
2. 规范性引用文件 1
3. 术语、定义和缩略语 5
4. 总体说明 8
4.1. 概述 8
4.2. 目标 9
4.3. 原则 9
5. 数据治理体系 10
5.1. 总体框架 10
5.2. 组织架构 10
5.2.1. 组织构成 11
5.2.2. 角色职责 11
5.3. 系统架构 12
5.3.1. 系统功能框架 12
5.3.2. 系统模块流程 14
5.4. 系统边界 15
5.4.1. 与企业级省大数据平台关系 16
5.4.2. 与对外能力开放平台关系 16
5.4.3. 与平台运维系统关系 16
6. 数据治理核心模块 16
6.1. 数据标准管理 16
6.1.1. 背景 16
企业级省大数据平台数据标准管理 17
经营分析系统数据管控 17
6.1.2. 目标及原则 17
6.1.3. 业务分类和定义 18
6.1.4. 技术功能要求 21
6.1.5. 本期建设范围及内容 25
6.1.6. 实施要求 26
6.2. 元数据管理 26
6.2.1. 背景 26
6.2.2. 元数据运营模式 27
6.2.3. 元模型标准 28
6.2.4. 元数据运维 32
6.2.5. 本期重点建设内容 32
6.3. 数据质量管理 33
6.3.1. 与传统经营分析系统的区别 33
6.3.2. 范围和原则 34
6.3.3. 与其它功能模块的关系 34
6.3.4. 本期数据质量功能需求 37
6.3.5. 本期数据质量运维要求 38
6.4. 数据资产管理 39
6.4.1. 数据资产概述 39
6.4.2. 数据资产范围 40
6.4.3. 与其它功能模块的关系 41
6.4.4. 本期数据资产功能需求 41
6.4.5. 本期建设内容 44
6.5. 数据安全管理 44
6.5.1. 数据安全概述 44
6.5.2. 建设原则 45
6.5.3. 建设内容 45
6.5.4. 边界关系 45
6.5.5. 技术功能 46
6.5.6. 管理要求 47
7. 数据治理场景 50
7.1. 背景描述 50
7.2. 场景一:银行伪卡交易判别 51
7.2.1. 背景介绍 51
7.2.2. 场景描述 51
7.3. 场景二:银行手机贷业务 52
7.3.1. 背景介绍 52
7.3.2. 场景描述 53
8. 附录 54
附录一:数据标准框架 54
附录二:数据标准体系定义内容示例 54
总体说明
概述
本规范用于指导企业级省大数据平台
数据治理子系统建设,规定了省大数据平台数据治理的范围和要求,明确了数据治理子系统的体系结构,制定了数据治理子系统的功能和处理流程。数据治理子系统包含数据标准管理、元数据管理、数据质量管理、数据资产管理、数据安全管理等功能模块。本方案借鉴资产管理的方法理论来管理数据,
将数据作为一种特殊的资产,对
进入平台的数据进行标准化的规范约束,并以元数据作为驱动,连接数据的标准管理、数据质量管理、数据数据安全管理的各个阶段,形成统一、完善的数据治理体系,以解决实际业务问题为导向,增强数据治理子系统对业务发展的支撑能力。目标
数据治理子系统的建设为数据治理工作提供强有力的系统支撑。本期规范建设目标是以元数据为驱动,建立省大数据平台完整的数据治理体系。从组织架构、系统功能等方面增强数据宏观管控,并实现精细化管理,具体包括:- 数据治理组织架构管理:定义数据治理所需人员组织上的岗位和职责,从管理角度支撑数据治理工作的落地和执行。
- 数据标准管理:建立企业级省大数据平台数据标准体系,并制定数据标准运维管控制度和流程。
- 元数据管理:降低元数据使用难度、提升用户体验,使大数据平台各类用户均能参与到元数据运营维护当中。
- 数据质量管理:为内、外部用户提供平台化的数据质量监控;通过扩充和优化公共规则库、保证数据的完整性、一致性、准确性、及时性、合法性,提升用户使用感知;并提供数据质量应用满足个性化需求。
- 数据资产管理:重点建设从规划、注册、运维到注销的全流程管理体系,使数据资产管理系统化、可视化。
- 数据安全管理:建立体系化的数据安全管控策略,通过用户安全管理、数据安全管理实现全方位的数据安全管控机制,通过技术手段与管理措施相结合的方式落实数据安全,做到事前可管、事中可控、事后可查。
原则
企业级省大数据平台数据治理子系统建设应遵循以下基本原则:
体现大数据平台数据治理过程中数据的标准、质量、价值、管控的有效性、高效性。
体现数据治理过程中以数据资产为核心,最大化大数据平台的数据价值。
体现大数据平台架构统一、标准统一、元数据统一、质量流程统一、资产价值统一的一体化管控平台体系。
体现平台化、开放性运维思想,实现人人参与数据治理、人人参与数据运维。
体现大数据平台数据治理能力的显性化,通过产品化互联网思维服务大数据平台数据生态圈用户。
体现安全的重要性、必要性,保障大数据平台数据安全和数据治理过程中数据的安全可控。
数据治理体系
总体框架
数据治理总体框架包括组织架构、数据治理模块、数据运维三部分。通过组织架构建立管理办法,制定工作流程,确定角色职责。数据治理模块主要包括数据标准管理、元数据管理、数据质量管理、数据资产管理、数据安全管理,各模块协同运营,确保大数据平台的数据一致、安全、有效。数据运维贯穿整个数据治理体系的流程中,实现平台化的运维管理思路。数据治理总体框架如图5?1所示:
核心领域
大数据平台
数据治理工具
数据安全管理
数据资产管理
元数据管理
数据质量管理
数据标准管理
组织架构
组织架构定义
角色与职责
规划和策略
管理办法
数据运维
质量运维
管控运维
资产运维
图5?1数据治理体系框架
组织架构
数据治理组织的构建旨在通过建立数据治理组织架构明确各级角色和职责,保障数据治理的各项管理办法、工作流程的实施,推送数据治理工作的有序开展。
组织构成
数据治理组织架构主要由数据治理委员会、数据治理中心和各业务部门构成。组织架构划分和角色设定如图 5?2所示:
图 5?2 数据治理组织架构图
角色职责
组织责任体系是数据治理责任落地的保障,数据治理组织架构通过明确各角色职责,实行认责制度,让数据治理工作更好的融入到数据日常使用和相关的工作中,从而推动数据运维自治的实现。
系统架构
系统功能框架
数据治理功能框架明确了数据治理在企业级省大数据平台中的定位,并以合理的功能层次划分指导数据治理系统相关功能建设。系统功能框架如图5?3所示。
图5?3数据治理功能框架图
企业级省大数据平台统一的访问接口,供企业内、外部用户、第三方独立开发者访问及使用数据治理相关产品或功能,并负责统一访问认证及日志记录。
企业级省大数据平台统一的对外服务层,数据治理相关的产品及应用均通过这个层次进行注册、发布,并对内、外部开放。
- 数据治理系统:数据标准:在数据标准管理组织架构推动和指导下,遵循协商一致制定的数据标准规范,借助标准化管控流程得以实施数据标准化的整个过程。元数据:采用集中式管理模式进行元数据管理,全公司元数据逻辑集中,即元数据管理模块作为公司元数据的统一发布源,集中管理元数据,提供元数据集中创建、维护、查询功能。数据质量:对数据从计划、获取、存储、共享、维护、应用、消亡生命周期的每个阶段里可能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平使得数据质量获得进一步提高。数据资产:规划、控制、提供数据及信息资产的一组业务职能,包括开发、执行和监督有关数据的计划、政策、方案、项目、流程、方法和程序,从而控制、保护、提高数据资产的价值。数据安全:通过计划、制定、执行数据安全政策和安全策略措施,为企业级大数据平台的数据和信息提供行之有效的认证、授权、访问和审计。数据运维:包括数据资产运维、数据质量运维,借鉴互联网思维,通过产品化运维工具来整体提升企业级大数据平台数据运维效率。
- 企业级省大数据平台:大数据基础平台,负责数据的接入、存储、管理、应用及相关基础功能支撑。
系统边界
企业级省大数据平台数据治理子系统与其它子系统之间存在数据交互、功能调用、流程穿插等关联。数据治理子系统与大数据平台系统内其它子系统的关系示意
与企业级省大数据平台关系
企业级省大数据平台上的数据资产是数据治理的主要对象;数据治理为企业级省大数据平台提供数据标准指导、元数据定义、数据质量监控、数据安全等方面的全面支撑,使大数据平台上的数据资产清晰、有序、安全、可控。
与对外能力开放平台关系
数据治理为对外能力开放平台提供元数据查询、数据安全管理支持;对外能力开放平台为数据治理提供统一的数据治理产品及功能注册、发布、使用服务。
与平台运维系统关系
数据治理子系统支撑大数据平台的数据管控流程,并与平台运维交互协调,共同支撑大数据平台整体的安全运维、数据运维和管理运维。
数据治理核心模块
数据标准管理
背景
XXX企业级省大数据平台数据标准是在经营分析系统数据管控要求基础之上,借鉴互联网企业数据治理的经验而提出的。数据标准是指在XXX企业级省大数据平台下,保障企业内外部使用和交换数据的一致性和准确性,具有行业特点且共同使用的一种规范性约束。
数据标准是企业级省大数据平台数据治理的基础性工作,是数据治理建设中的首要环节。首先,数据标准为企业级省大数据平台提供统一的数据标准定义和平台逻辑模型。其次,数据标准是企业级省大数据平台进行数据治理的依据和根本。再次,数据标准是衡量企业级省大数据平台数据资产运营和管理的评估依据。最后,XXX通过数据标准管理的实施,实现对企业级省大数据平台全网数据的统一运营管理。
企业级省大数据平台数据治理体系中数据标准管理如图6?1所示,包括制定数据标准的规范性文件、进行数据标准化管控及
数据标准管理组织。
图6?1数据标准管理内容
企业级省大数据平台数据标准管理与原经营分析系统数据管控的区别如下表6?1所示:
表6?1企业级省大数据平台数据标准管理与原经营分析系统数据管控区别
企业级省大数据平台数据标准管理
原经营分析系统数据管控
数据范围
涉及企业内外部数据运营相关的数据,包含BOM三域数据、外部数据。
数据仅限于市场经营活动的B域和部分O,M域数据。
业务应用模式
以数据标准为基础的数据治理体系,实现数据的资产化,贯穿整个数据运营的全流程,形成以XXX大数据平台为核心的大数据生态圈,服务于企业内外部客户。
以支撑企业内部经营分析为主。
服务对象
服务于整个大数据生态圈。
原经营分析系统使用人员。