数字化转型白皮书(2021)(四)-混合云的数据架构(1)

    混合云的数据架构

    来源:中国企业数字化联盟

    (三)混合云的数据架构

    随着数字经济发展,数据已和其他要素一起融入经济价值创造过程,对生产力发展有广泛影响,而混合云作为一种新型的IT架构,实现了多云协同、云上云下协同,为数据要素的流通提供了最有利的支撑。根据企业的需求,混合云可以支持多种数据应用场景,例如:

    • 将私密数据放在本地,非私密数据或公开访问入口放在公有云;
    • 从公有云获取数据,使用公有云的计算服务,分析后存放在本地;
    • 使用公有云的计算服务(如Al分析服务),分析本地的数据;
    • 数据访问能力在高峰期能利用公有云的资源进行无限拓展;
    • 多数据中心通过公有云实现星形连通从而实现物理分散、逻辑统一的数据互通;
    • 多级云互联,上下级云之间可以实现协同计算;
    • 本地数据能加密备份在公有云,或者实现跨云的灾备。

    由于混合云构建在跨云、跨地域的IT基础设施上,其数据架构的主要内容是多云、多地域的数据整合、管理和应用。但是从本质上讲,混合云的数据架构依然遵循企业架构的设计方法,并没有因为混合云IT架构的复杂性而产生本质的变化,只是在数据的分布、计算的方式上产生了更多的新技术和新形态。

    从体系架构的视角出发,连循数据资产化、数据标准化、数据服务化、数据价值化等原则,数据架构由数据目标数据标准数据模型数据分布数据治理数据安全等部分组成。

    混合云的数据架构

    数据目标是指建立面向业务的数据思考模型,建立面向未来的数据规划思维,这是打通数据孤岛、实现数据全集成的基础。基于业务目标或者业务假设,提前做数据利用的思考和规划,而不是等到业务系统已经构建好了,再去思考数据的事情,那个时假往往数据孤岛已经形成了。而混合云自身的IT架构的复杂性,就使得数据目标规划尤为重要,否则导致的跨云、跨地域的数据孤岛是一件更加灾难性的事情。

    数据标准是对各项数据的规范化定义与统一解释,对数据间的关系、业务规则及数据质量要求的统一定义、建立数据标准体系,能够实现跨云、跨业务、跨系统的数据统一和全局化管控,包括主数据管理、基础数据管理、数据交换标准管理。

    数据模型包括概念模型、逻辑模型和物理模型。数据模型设计要充分考虑性能,可用性和可维护性等,尤其要针对混合云IT技术架构考虑相关的非功能性指标。定义良好的数据模型可以反映业务模式的本质,确保数据架构为业务需求提供全面、一致、完整的高质量数据,且为划分应用系统边界,明确数据引用关系,定义应用系统间的集成接口,提供分析依据。

    数据分布有数据集中存放和数据分布存放两种模式,这两种数据分布模式各有其优缺点,需要综合考虑自身需求,以及数据关联性、数据类型、数据量、并发数、网络带宽、安全边界等情况,确定具体数据分布策略以及数据访问策略。同时,还需要分析数据的实时处理、批量处理、实时检索、交互查询等应用场景,选择混合云服务中适合的数据服务。

    数据治理指的是在数据全生命周期进行管控和治理,简单来说通过数据集成、数据管理和数据应用,构建“采集一分析一决策一反馈”的数据价值闭环。完整的数据治理流程还应该包括建立相应的组织和制度,发布数据标准、定义数据质量、监控反馈评价等内容。数据集成主要包括结构化数据和非结构化数梯的探查、采集、转换和集成;数据管理主要是对基础数据、基础数据组织融合后产生的衍生数据进行存储和管理,通过元数据管理和主数据管理形成完善、可用的数据视图。数据应用主要包括数据服务以及统计、预警、预测等智能分析。

    数据安全是指用于保护数据的流程和技术,阻止无意、有意或恶意的未经授权对数据进行访问、查看、修改或别除的情况发生。混合云带来的分布式的系统部署、开放式的网络环境,复杂的数据应用和众多的用户访问,对数据安全带来了新的挑战,海量,多源、异构、动态性等大数据特征导致网络边界变得模糊,传统的骑于边界的安全保护措施不再适用,多平台的身份认证、授权访问、秘钥服务及安全审计要求越来越高,同时系统中存在大量的个人数据,一旦淮露后果十分严重。