产品概述

联想数据资产管理Governance 将数据对象作为一种全新的资产形态,围绕数据资产本身建立一个可靠可信的管理机制,提供数据标准管理、数据资产管理、元数据管理、数据质量管理、数据安全等功能,为数据管理人员、运维人员、业务人员和应用开发者提供全方位服务与支撑。

产品架构
产品特性
  • 支持Hive,HDFS的元数据自动获取及全量更新和增量更新的方式

  • 支持数据质量智能评估、自定义检查规则及自定义告警

  • 支持全链路的数据处理流程血缘追踪及影响分析

  • 支持多层多级多角色的数据权限模型管理元数据,以及敏感数据过滤及主动探测隐藏

  • 支持数据操作安全审计及日志分析,主动拦截非法操作

产品功能
  • 数据生命周期管理

    对数据从上线、使用到下线整个生命周期的使用情况进行跟踪、记录和操作。功能包括:数据生命周期判定原则定义、生命周期查询/更改、数据生命周期监控、过期数据销毁等。

  • 数据标准管理

    企业级数据标准主要解决系统之间数据集成的标准,解决跨部门数据分析时数据一致理解。标准化需要解决的关键问题:标准制定,标准的执行和控制,标准化问题管理。

  • 元数据管理

    元数据管理是需要将各系统的信息、设计工具信息、生产平台信息,进行收集并统一管理。提供一个视图,以帮助使用人员了解系统的数据分布、数据关系、业务规则、指标口径等。元数据包括:业务类元数据、技术类元数据。 基于完整的元数据管理能力,提供血缘分析功能。可以以某个元数据为终止节点,以图形化方式展示前端与其有关系的所有元数据,反应数据的来源与加工过程。从而可判断数据来源,定位数据质量问题。 系统具备影响分析能力。可以以某个元数据为起始节点,以图形化方式展示后端与其有关系的所有元数据关系,反应数据的流向与加工过程。从而可以判断数据流向,定位数据转换中的错误。

  • 数据质量管理

    企业数据质量通常存在如下问题: 1. 稽核规则没有生效,数据质量风险难以及时监控发现; 2. 现有实际生效的稽核规则散落在各层的加工代码中,未成体系; 数据质量管理的总体目标:常态化、体系化、标准化、自动化的全面数据质量管理,以达到数据质量控制的全面性、可控性、可度量性、可迅速定位和有效解决。通过流程制度建设、质量评估体系建设、质量检测IT平台建设实现TDQM(Total Data Quality Manage),即企业级全面数据质量管理。 数据质量管理针对该形势提供波动检查,平衡性检查,阈值检查,有效性,一致性核查,并根据检查结果提供可选的告警形势,比如邮件推送等。 提供数据质量稽核规则统一配置,并支持对质量规则的定义和任意节点的附加。 根据时间发生的顺序,可分为事前质量检查、事中运行监控、事后归纳总结,并能对各过程中所产生事件及信息形成告警信息,通过短信、彩信、邮件的形式进行发送。

  • 数据安全与隐私保护

    数据资产管理平台可纳入原有的安全管理系统,运维人员对各主机数据库的访问均通过原有安全管理系统进行。运维人员需要访问主机数据库的数据时,需要首先登录原有安全管理系统门户,原有安全管理系统门户对用户进行身份鉴别和权限判别,确定用户的真实身份并判断是否有数据库的访问权限,如果没有权限则无法访问数据库的数据。身份鉴别和权限判别通过后,用户从原安全管理门户登录到要访问的数据库中,根据设置的安全策略进行访问控制,从而限制用户对数据库具体文件、目录和数据库表的访问。如限制用户只能对指定的数据库表执行查询操作,不能进行增删改操作。 在数据的应用迅速发展的同时,世界各国也日益增强了对个人识别信息(PII)的保护,不断出台数据监管和个人隐私保护的相关法律。为了保证数据平台的数据安全性,需要对不同层级数据访问者,如数据分析人员、数据管理人员、数据测试人员等,在保证数据逻辑完整性的前提下采用差异化的数据呈现方式。这需要对数据中个人身份信息和敏感信息,通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护,即数据脱敏技术。 模糊化的方式包括如下几种形式: 数据替换 - 以虚构数据代替真值。 截断、加密、隐藏或使之无效 - 以“无效”或 *****代替真值。 随机化 - 以随机数据代替真值。 偏移 - 通过随机移位改变数字数据。 字符子链屏蔽 - 为特定数据创建定制屏蔽。 限制返回行数 - 仅提供可用回应的一小部分子集 基于其他参考信息进行屏蔽 - 根据预定义规则仅改变部分回应内容(例如屏蔽 VIP 客户姓名,但显示其他客户)

核心技术优势
1、完整支持SQL标准、支持存储过程

提供数据标准管理、数据资产管理、元数据管理等功能,建立标准化、流程化的数据管理体系 。

2、关系脉络化

对数据全生命周期进行管理,梳理数据关系脉络,支持全链路的数据处理流程血缘追踪及影响分析,确保数据架构合理,条理清晰,过程可控,知识积累传承。

3、性能高效

10分钟可同步系统单数据源支持3万+张表元数据的初始化获取;支持单次10万行文本数据的导入和导出。

4、质量核查智能化

支持数据质量智能评估及自定义检查规则,并提供相应的信息统计及自定义告警;提供文件级、记录级、数据关联层面多种数据质量核查机制,自动发现数据处理流程中的各类问题,主动告警提示。

5、支持Hive,HDFS的元数据自动获取及全量更新和增量更新的方式
6、支持多层多级多角色的数据权限模型管理元数据,以及敏感数据过滤及主动探测隐藏
7、支持数据操作安全审计及日志分析,主动拦截非法操作

忘记密码?