AI手机与AIPC要安全,为什么离不开这款服务器CPU?
金磊 梦晨 发自 凹非寺量子位 | 公众号 QbitAI
随着生成式AI的火速发展,AI应用开始与各种信息设备“嫁接”,AI手机、AI PC,甚至AI汽车都变得越发屡见不鲜。
一方面,人们正在生存中享受着AI,尤其是大模型带来的便捷,可以随时随地向终端设备提出问题来答疑解惑,内容大概是一样平常生存中遇到的麻烦,也大概是单纯跟AI聊聊天解解闷,随手拍个大模型给你讲授人生鸡汤的视频发出来炫一下。
https://img-blog.csdnimg.cn/img_convert/a21699732ec0248c7b6560f176c63350.png
但另一方面,生成式AI上终端设备之后,更多地在向AI生产力的方向发展。
换言之,人们在工作上也越发地开始依赖大模型,例如直接把文档、表格、图片丢给设备来剖析、处理。
这就引发了一个不知不觉中发生,也不可避免的话题——安全性。
因为不论AI应用在何种信息设备上集成,在利用过程中都会收集和产生大量用户数据,如个人信息、通信纪录、浏览历史、生物特性数据等,这些数据对于用户来说具有高度的敏感性。
就比如之前的保举模型仅仅是根据用户的浏览历史、搜索纪录、购买举动等数据,就可以让用户身陷信息茧房,只保举用户大概感爱好的内容,限制了视野的拓展,再从电商角度“杀个熟”。
而大模型加持的这些AI终端设备,涉及到用户生存的更多方面,包括通信、工作、娱乐、金融等,甚至将来某一天它与汽车联合成为你的“副驾”,或与家务呆板人联合后成为你的管家或护工时,还大概会把你家里家外的事儿摸个底儿掉。
以是它一旦出现安全问题,其影响范围将远远超过保举模型,大概导致用户的产业损失、身份被盗用、工作制止等严重后果。
或许有人会说了,很多AI终端厂商在做宣传的时间都在强调断网运行,由此可以保障本地文件或信息的安全性。
但事实真是如此吗?
非也非也。
AIGC应用,需要端云协同
AIGC应用在终端利用的过程中,一个显着的趋势是如许的——
能力越强的AIGC应用都应当是端云协同,这才是数据处理模式的将来趋势。
之以是如此,是因为在大模型的应用过程中,充沛的算力和海量高质量的数据都是关键中的关键,直接影响用户在终端的体感。
尤其在众多面向终端部署的个人化应用里,一旦练习或推理过程有大规模盘算资源到场此中,算力相对较弱的终端便会显得力不从心;一旦用户探求的信息或答案需要专门的数据库甚至高度构造的知识库的支持,都会成为阻碍AIGC应用进一步拓展的瓶颈。
那么端云协同又是怎样破局的呢?它的“打开方式”是如许的:
https://img-blog.csdnimg.cn/img_convert/cd5ad6f3e1b78350b49b976168d4a0fd.png△面向AI的端云协同架构
在端云协同的这一模式下,终端设备主要负担起与利用者直接相关的各类数据的采集与预处理工作。
它如同一个敏锐的观察者,时刻感知着附近的环境变化,将各种原始数据收集起来,并进行初步的整理和筛选。
而那些复杂的盘算使命,以及对更多数据的访问则交由强大的云端算力来完成。云端就像是一个更有智慧的大脑,拥有着巨大的盘算资源和先进的算法或更大参数目标复杂模型,另有个人用户难以企及的超大规模数据来供其练习或访问,可以更快速、更正确地给出答案或辅助处理需求。
如许一来,即使终端设备本身的算力和数据有限,也能够借助云端强劲的AI算力和数据积贮来实现更加复杂的功能和服务。
比如,在图像识别领域,终端设备可以快速拍摄照片并进行简朴的图像裁剪和调整,然后将图像数据上传至云端。
云端利用其强大的盘算能力和深度学习算法,对图像进行高精度的识别和分析,最后将效果返回给终端设备,为用户提供详细的图像信息和相关的服务建议。
在语音处理方面,终端设备可以采集用户的语音信号并进行降噪等预处理,云端则负责对语音进行识别、翻译和语义理解等复杂的处理使命,从而实现智能语音助手的强大功能。
这种模式虽好,但当客户端各类数据需要传输至云端进行处理的时间,云端可信环境的重要性便立刻凸显出来。
所谓云端可信环境,指的是在云端能够确保终端传来的隐私数据以及自身存储的各类关键数据在处理和交互时,都能被更好地保护,不被非法访问、窜改或者泄露。在这个数据驱动的期间,尤其是面向企业级应用,如许的环境至关重要,其意义不言而喻。
一方面,云端可信环境直接关系到用户信任度的高低。
用户在利用各种基于AI技术的应用时,会将大量的个人数据上传至云端进行处理;如果云端环境不可信,用户的隐私数据随时大概面临被盗取、滥用的风险,这无疑会让用户对这些应用产生极大的担心和不信任。
另一方面,云端可信环境还将影响到AI技术与应用的恒久发展和社会接受度。
如果云端的安全性无法得到保障,频仍出现数据泄露等问题,不但会损害用户的利益,还会引发社会对AI技术的质疑和担心。这也将极大地阻碍AI技术的进一步发展和推广。
那么何以解忧?CPU,了解一下。
或许在很多人的固有认知里,在云上或数据中心里,与AI数据处理相关的硬件更多应当向GPU或者专用加速器靠拢;但现实上,CPU作为系统的中心处理器,它才具备对整个系统的全面控制能力。
例如在云端协同的数据处理中,CPU能够对数据的传输、存储和处理进行全面的监控和管理,如访问控制、身份验证、数据加密等。
相比之下,GPU和专用加速器主要专注于特定的盘算使命,缺乏对系统的全面控制能力,难以有效地执行安全计谋。
至于CPU详细是怎样在这个过程中发挥作用的,我们继续往下看。
基于CPU的可信执行环境
说到构建云端可信环境,离不开一个关键技术——可信执行环境(TEE)。
它通过在硬件中创建隔离区域,保护内存中的敏感数据不被非法访问、窜改或泄露。可信执行环境能够为敏感数据和代码提供独立于操作系统和硬件配置的加强安全防护。
想要在“端云协同”模式下构建可信执行环境,还可以从以下几个方面入手:
采用硬件级安全技术:
目前这方面的技术,成熟且应用较多的,当属英特尔® 软件防护扩展(Intel® SGX)和英特尔® 信任域扩展(Intel® TDX),它们或在内存中构建被称为“飞地”(Enclave)的安全区域,能做到应用隔离,来保护最关键的敏感应用和关键数据,或将TEE环境扩展到捏造机层面,实现捏造机隔离,来保护某个捏造机环境中的数据和应用步伐免遭未经授权的访问。
https://img-blog.csdnimg.cn/img_convert/3ee0a766676f7c7b00e9d87342840e51.png
构建长途认证和密钥管理体系:
引入英特尔® 数据中心验真原语(Intel® DCAP)等技术,构建长途认证服务和密钥分发服务。确保只有颠末验证的用户和设备才气访问云端资源,来更好地保护数据免受未授权的访问和泄露。
采用可信的运行环境和工具:
利用开源的轻量级操作系统,如Gramine,确保可信运行实例的创建、加载与运行。Gramine支持对网络通信进行加密,并可将长途认证协议(RA-TLS)下沉,实现对应用步伐透明的加密网络通信。
https://img-blog.csdnimg.cn/img_convert/d759e3099c6eae912d3932efbf6135cf.png
基于SGX、TDX构建的云端TEE环境,再配合长途证明等配套服务,就构成了一套完备的面向AI使命的云端可信方案,可以为数据提供全方位的保护。
数据可信盘算:通过云平台机密容器的构建和部署,构筑了基于TEE的双路可信AI沙箱,将AI应用的处理流程放入此中,让用户隐私数据在云端“可用不可见”。
数据可信传输:业务侧对用户隐私数据进行加密传输,同时借助长途认证服务,使业务开发或运维人员也无法获取明文数据,确保数据在传输过程中的安全性。
数据可信存储:业务侧对用户隐私数据进行加密存储,相关根据类敏感数据也基于"飞地"加密存储,防止未经授权的访问。
由此可见,这套架构不但可以保护静态数据,更是补齐了数据在处理和交互中的安全防护能力,做到在全流程中更好地”保驾护航”。
https://img-blog.csdnimg.cn/img_convert/55949b0ce31d98131caea3110920fe92.png△面向AI的端云协同架构英特尔® TDX技术架构
在大家认识的英特尔® 至强® 处理器上,相关安全技术的探索,早在几年前AI应用还处于练习为主的期间就已经有过乐成用例。
例如阿里云企业级ECS实例g8i方案,就通过引入第五代英特尔® 至强® 可扩展处理器,构建了有弹性可信边界、且易于将应用步伐部署在此中的分级机密盘算新方案。
基于此,阿里云提供了机密捏造机和机密容器两种利用模式,并推出了采用英特尔® TDX的BigDL大模型隐私保护方案。
不但能保障AI推理阶段,在预处理、数据准备、模型练习等阶段都可以对利用中的数据进行保护,更好地保证数据、模型的隐私机密性。这不但加强了对用户隐私的保护,也保护了名贵的模型资产不被盗取。
https://img-blog.csdnimg.cn/img_convert/9098bddc08e21f9e6aff2c671fca920f.png△英特尔® TDX技术架构
另有金融业的平安科技和其他行业一些AI应用的前锋,更早时就曾探索基于SGX技术来实现更安全、更可信的联邦学习,或者隐私保护的呆板学习应用,固然这些应用也都属于练习范例,也都是面向那些乐意提供自家数据来练习一个共有模型的多家企业或机构,让他们的数据在这一过程中得到更好的保护。
再往返顾至强CPU安全能力的进化史。英特尔在这条蹊径上从未止步。
在至强® 处理器中,SGX初次作为附加功能出现在第二代英特尔® 至强® 可扩展处理器中,并在第三代至强® 可扩展处理器中成为标准功能。
而TDX初次在2023年随第四代英特尔® 至强® 可扩展处理器(代号Sapphire Rapids)引入。第五代至强® 可扩展处理器进一步推广了TDX技术,使其在市场上更广泛可用。
随着AI技术的不停发展和应用场景的不停扩大,加强数据隐私和安全的需求将日益凸显。构建云端可信环境,不但为云上用户数据提供全方位的保护,也为大模型、生成式AI的个人化落地,以及“端云协同”模式下的数据安全与隐私保护提供了有价值的参考。
而这统统,都有英特尔® 至强® 这款服务器CPU在背后冷静发力和支持。
而今,在最新一代至强® 6处理器产物上,不论是6月发布的能效核(E-core)产物,还是刚刚官宣的,拥有更强单核性能、更高核心/盘算密度、更高能效体现、以及更强内存和IO支持的性能核产物——至强6900P系列身上,SGX和TDX都未缺席,正是它们为这些CPU产物增添了“更安全可靠”的定语,也为AI应用和数据的安全保障带来更加可行、可用,易用,好用的保障。
为了科普CPU在AI推理新期间的玩法,量子位开设了《最“in”AI》专栏,将从技术科普、行业案例、实战优化等多个角度全面解读。
我们盼望通过这个专栏,让更多的人了解CPU在AI推理加速,甚至是整个AI平台或全流程加速上的实践结果,重点就是怎样更好地利用CPU来提升大模型应用的性能和效率。
更多英特尔® 至强® 可扩展处理器为企业云服务提供更优安全防护的案例,可点击阅读原文获取。
https://img-blog.csdnimg.cn/img_convert/19e47a144a8b1787ce1a0a64b71668fa.png
— 完 —
点这里
页:
[1]