一、ECS产品安全体系及机密-计算介绍
用户将数据迁移到云端时,最核心的关切无疑是数据的安全问题。他们担心云上的数据链路可能不完整,害怕数据被恶意攻击者窃取,更担忧云服务商可能监守自盗,窥探用户数据。这些担忧并非空穴来风,而是基于对数据安全和隐私保护的高度重视。
如今,数据已晋升为与土地、劳动力、资本、技术并驾齐驱的第五大生产要素。在合法合规的前提下,最大化数据价值已成为每个企业的迫切需求。国家队也在政策层面给予了全力支持,如最新的会计准则明确将数据作为企业资产的一部分,允许其参与金融活动,如交易、质押融资等,这无疑为数据的大规模交易流动奠定了坚实基础。
然而,随着AIGC大模型的崛起,数据的重要性愈发凸显。大语言模型AIGC的三大核心要素是数据、算法和算力。其中,算法方面,开源算法已能与商业公司的闭源算法相匹敌;算力方面,只要有足够的资金,也可以轻松获得。唯独数据,是每个企业独有的宝贵资产,无法轻易获取。但遗憾的是,当前全球数据安全威胁日益严重。一方面,数据呈现爆炸式增长,关键数据众多,保护难度加大;另一方面,恶意攻击者的手段不断升级,防不胜防。
客户对数据安全的要求也越来越高。他们不仅要求防止外部黑客和病毒的攻击,还要应对内部数据管理混乱和员工安全意识淡薄导致的数据泄露风险。此外,暗数据的存在也给数据安全保护带来了挑战。这些数据可能隐藏在非结构化的信息中,如纸质扫描件或合同发票等,企业往往难以察觉和保护。
在数据交易、共享、联邦学习和同态加密等过程中,更需要严格的数据保护措施,确保多方在数据共享和共同建模时能够保障数据的可用但不可见。
阿里云深知市场需求和用户在数据安全保护中遇到的痛点。因此,我们针对性地从数据安全、数据存储、数据计算等全链路构建数据安全保护网。
在数据存储方面,我们提供云盘数据的加密能力,包括快照加密和镜像加密等,确保用户数据在云上存储的安全。同时,我们也对数据传输过程进行全面的安全保护,构建防攻击网络,包括访问控制、安全组、网络隔离等措施,确保数据在传输过程中的安全。
更值得一提的是,我们还关注数据计算过程中的安全保护。今年,我们重点构建了这方面的能力,利用TEE硬件机密计算技术,如Intel SGX/TDX、AMD SEV等,对内存中频繁读写的数据进行加密保护,确保数据在计算过程中的安全。
二、多方数据协作
阿里云始终致力于为用户提供最安全、最可靠的数据保护服务。我们相信,通过我们的努力,用户可以更加放心地将数据迁移到云端,享受云计算带来的便利和效益。
阿里云今年在数据安全保护领域取得了重大突破,其中机密虚拟机技术的推出成为了焦点。这项技术覆盖了Intel、AMD、海光三大CPU平台,为用户提供了一种全新的数据安全保障方案。
在Intel平台上,阿里云早在第7代时便推出了基于Intel SGX技术的g7t实例,实现了机密虚拟机的能力。今年,我们进一步推出了基于Sapphire rapid和后续演进到EMR技术的g8a实例,它采用了Intel最新的TDX技术。这一技术的核心优势在于解决了上一代SGX使用门槛过高的问题,为用户提供了更加便捷的数据安全保护方案。
同时,在AMD平台上,我们全新推出了8代AMD实力的g8a和g8ae实例。这些实例不仅在性能和性价比方面有了大幅度提升,更在数据安全保护上迈出了坚实的一步。它们基于AMD SEV技术实现了机密虚拟机功能,用户无需对现有业务进行任何代码级别的改造,只需在官网控制台购买并勾选SEV能力,即可使业务直接运行在机密虚拟机环境中,实现数据在内存中的全面加密保护。
此外,在国产处理器方面,我们也不遗余力地推进数据安全保护技术的发展。基于海光3号的g7h实例便是其中的佼佼者。它搭配了阿里云自研的CIPU架构以及中国自主研发的海光处理器,在操作系统层面兼容国产的麒麟、统信等操作系统。同时,g7h实例还支持国密CSV机密虚拟机以及VTPM可信计算,从硬件到软件全链路满足数据安全的需求,特别适用于国内关键基础设施和关系民生的系统。
值得一提的是,所有基于Intel、AMD、海光三大处理器平台的ECS实例,底层都由阿里云自研的CIPU架构驱动。在这一层,我们还植入了VTPM可信计算的能力,实现了启动全过程的可度联,有效杜绝了类似Rootkit、Bootkit等底层恶意软件的攻击。通过TEE机密虚拟机和VTPM可信计算的结合,阿里云在云上构建了一个厚重的数据保险柜,为用户的关键数据提供了坚实的安全保障。
关于阿里云构建的数据保险柜的安全级别,我们首先需要了解可信计算机的概念。可信计算机是指一个提供安全执行环境的组合体,包括硬件、固件和软件。对于云服务商的不信任,机密虚拟机技术提供了最底层的解决方案。它就像一个租客在房子中放置的保险柜,只有拥有钥匙和密码的人才能打开,从而确保了数据的安全性。
阿里云机密虚拟机的能力图谱展示了从左到右安全级别的逐次提高。目前,基于Intel SGX技术的g7t实例在安全能力上达到了最高水平,但使用门槛也相对较高。而基于Intel TDX、AMD SEV和海光CSV技术的机密虚拟机则具有较低的使用门槛,用户几乎无需进行代码层面的改写即可直接使用。此外,基于TM1内存加密和阿里云Enclave技术的机密虚拟机也提供了基础的数据安全防护能力。
这些能力并不是相互独立的,而是可以叠加使用的。例如,TM1内存加密可以与TDX技术结合,为用户提供更为全面和强大的数据安全保护。在创建实例过程中,用户只需在官网控制台勾选相应的机密虚拟机特性选项,即可轻松启用这些安全功能。
总的来说,阿里云通过机密虚拟机技术的不断创新和发展,为用户提供了一个强大而便捷的数据安全保护方案。无论是国内还是国际用户,无论是关键基础设施还是普通业务系统,我们都能为其提供满足极致稳定性和安全性需求的数据安全保护服务。
阿里云提供的机密虚拟机能力,为用户带来了与线下自建数据安全保护相媲美甚至超越的体验。这使得用户可以轻松构建自己的隐私计算平台,满足各种数据安全和隐私保护的需求。
目前,许多数据服务商已经开始在阿里云上构建隐私计算服务平台,如多方计算、联邦学习、同态加密和隐私求交等。这些服务不仅利用了阿里云提供的机密虚拟机技术,还享受到了云平台的便利。首先,算力资源的弹性使得这些服务在需求高峰时能够迅速扩展,而在需求低谷时则可以释放资源,极大地降低了成本。其次,机密虚拟机的硬件加密技术相比传统的软件方案,在通用性、计算效率和通讯效率上都有显著提升,从而提升了服务的性能。最后,云平台的便捷性使得数商客户能够快速构建并交付POC测试环境,提高了获客效率和客户满意度。
接下来,我们深入了解一下机密计算的具体应用。机密计算通过CPU内部电路对内存数据进行加密,防止外部利用特权访问机密内存区的数据和代码,从而保障数据的完整性和机密性。这种技术在数据保护要求极高的领域有着广泛的应用。
以数据交易场景为例,多方数据协作和数据产品交付是两个典型的应用场景。在多方数据协作中,多个数据参与方需要共享数据以进行联合计算,但同时又不能泄露各自的隐私数据。机密计算技术为这种场景提供了良好的解决方案。传统的协作方式通常需要一个可信第三方来管理数据,但这存在数据泄露的风险。而机密计算则可以在不暴露数据明文的情况下进行计算,保证了数据的机密性和可用性。
此外,蚂蚁集团实现的信托邦数据协作平台就是一个成功应用机密计算技术的案例。该平台基于阿里云的机密虚拟机技术构建,提供了一个安全、可信的数据协作环境。多个数据参与方可以将自己的数据提交到信托邦中,通过机密计算进行联合计算,得到有意义的结果,同时保证了数据的机密性和完整性。
综上所述,阿里云提供的机密虚拟机技术和机密计算解决方案为用户提供了强大的数据安全保护能力,并在多个领域得到了广泛应用。未来,随着技术的不断进步和应用场景的不断拓展,我们相信机密计算将在数据安全领域发挥更加重要的作用。
三、数据产品交付
接下来,我将为大家详细介绍数据交易的另一重要场景——数据产品交付。
在数据产品交付场景中,甲方通常扮演数据消费者的角色,而乙方则是数据拥有者。乙方需要将数据以产品形式打包并交付给甲方使用。这一过程中,主要存在两种交付方式:API交付和离线数据交付。
API交付是通过定义和封装API接口来实现数据的访问和使用。这种方式通常适用于线上服务场景,但可能涉及到较高的运维和资源租赁成本。
相比之下,离线数据交付则不需要线上运维和资源租赁,因此具有较低的成本。然而,它也存在一定的风险,如数据在流转过程中可能泄露,被非法二次分发或扩散,以及因数据处理不当导致的个人隐私泄露等。
为了解决这些问题,我们提出了一种基于机密隐私保护的SCQL应用的参考方案。SCQL是在传统数据库(如MySQL、PSQL)之上封装的一个SQL分析引擎。它根据数据拥有者定义的CCL(约束性语言)对SQL查询进行检查,从而确保敏感字段的数据不会对使用者泄露。同时,利用机密计算技术保护软件本身和内存中的数据,进一步降低数据泄露和隐私泄露的风险。
SCQL作为一款安全、协作的查询语言,允许数据拥有者给不同的用户授予不同的数据访问权限。通过CCL机制,数据拥有者可以精确地定义数据的使用方式和披露限制。SCQL会拒绝不满足CCL要求的查询,从而确保数据的安全性和隐私性。
在实际应用中,数据拥有者可以将数据灌装到离线的数据文件中,并根据隐私保护需求为敏感字段定义CCL。然后,对离线数据文件进行加密,并将加密后的文件与SCQL一起打包成TEE(可信执行环境)应用镜像。这样,即使文件在传播过程中被截获,也无法获取其中的敏感数据。只有当TEE镜像在云平台的TEE硬件上运行时,文件才能被解密并被数据库软件访问。同时,由于SCQL的查询受CCL限制,用户无法获取到受保护的字段的明文数据。
通过这种方式,我们可以实现安全、可控的数据产品交付。数据拥有者可以灵活定义数据的访问权限和使用限制,而数据消费者则可以在不泄露敏感数据的前提下进行数据分析和使用。这不仅降低了数据泄露的风险,还提高了数据交易的效率和可靠性。
在接下来的演示中,我将为大家展示如何使用SCQL进行数据产品交付的具体操作过程。通过实际操作,大家将更深入地了解这一方案的实际应用效果。