您现在的位置是:数据库 >>正文

破局智算中心挑战,施耐德电气的应对之道

数据库43人已围观

简介2022年底,ChatGPT的横空出世引爆了全球对生成式人工智能的关注热潮。紧随其后,多模态大模型、AI视频生成、代码自动生成等技术的突破,正在重塑千行百业的创新范式。AI技术的飞速发展,在推动企业业 ...

2022年底,破局ChatGPT的智算中心之道横空出世引爆了全球对生成式人工智能的关注热潮 。紧随其后 ,挑战多模态大模型 、施耐AI视频生成 、德电代码自动生成等技术的应对突破 ,正在重塑千行百业的破局创新范式 。AI技术的智算中心之道飞速发展,在推动企业业务创新,挑战提高企业生产效率的施耐同时,也给数据中心带来了前所未有的香港云服务器德电压力 。

然而 ,应对在这场看似属于算法与数据的破局竞赛背后 ,却是智算中心之道一场关于算力  、供配电与制冷能力硬核基础设施的挑战较量  。

AI加速数据中心技术变革 ,基础设施面临三重考验

近年来 ,AI大模型发展被按下“提速键”,加速向多场景渗透 ,以前所未有的深度和广度改变数据中心的传统面貌。中国信通院数据显示,模板下载截至2024年6月,我国在用算力中心超过830万标准机架,算力规模达到246 EFLOPS(FP32),智算同比增速超过65%。

在笔者看来,大模型应用爆发增长的背后 ,是AI工作负载对数据中心基础设施提出的严峻挑战 。主要有以下三点:

一是功率密度大幅跃升。传统数据中心单机柜功率通常在5-10kW  ,而AI服务器集群直接将这一数字推高至30kW、50kW甚至100kW以上。以英伟达最新的高防服务器GB200为例,更是将单机柜功率密度推向120kW。

二是电力质量要求严苛。AI训练任务通常需要连续运行数周甚至数月  ,任何电力中断都可能导致训练任务失败  ,造成巨大经济损失 。同时,AI工作负载具有剧烈动态波动特性 ,50毫秒内可达30%-165%波动 ,对供配电系统的可靠性提出了极高要求 。

三是制冷瓶颈凸显 。随着芯片功耗不断提升,服务器租用风冷已逐渐触及物理极限 。未来 ,单个GPU功耗超过1kW或将成为常态 ,传统风冷方式无法有效解决高密度计算节点的散热问题 ,液冷将成为必然趋势 。

近期 ,在施耐德电气卡车巡展北京站现场 ,施耐德电气关键电源业务 ,IMDC及边缘计算产品经理汤熠指出 ,当前,芯片性能提升速度已经超越了摩尔定律,机柜功率密度及功耗均将实现指数跃迁。毫无疑问 ,智算中心将以惊人的速度进化,云计算AI更将突破奇点。

施耐德电气关键电源业务 ,系统业务产品经理连博指出,AI驱动下的算力变革亦在深刻重塑电力需求与使用模式 。为有效应对能源供应的严峻挑战 ,数据中心亟待部署更多、更优质的电力资源 。

施耐德电气的应对之道 :创新产品与解决方案

面对AI时代数据中心面临的诸多挑战 ,施耐德电气凭借其深厚的技术积累和前瞻性的市场洞察 ,建站模板推出了一系列创新产品和解决方案 。其中,冷板式液冷CDU系统、Galaxy VXL UPS和IMDC智能模块化数据中心尤为引人注目,这也是本次施耐德电气卡车巡展北京站活动中所展示的重点产品 。

一)风冷液冷融合,打破散热瓶颈

前文提到,机柜功率密度的不断提升使得制冷成为摆在用户面前的一大挑战。数据中心运营者不仅亟需升级制冷方式 ,如何降低数据中心的整体能耗,符合国家节能减排政策的要求 ,也成为重点考虑的问题。

汤熠表示,单机柜的功率密度未来3年将会达到500 kW,5年内有望达1 MW。单机柜功率密度超过50 kW ,液冷将会变成必选项,即风冷无法满足50 kW机柜散热的问题  。

为满足高密度数据中心的散热需求,施耐德电气基于对客户需求的深刻洞察,推出的冷板式液冷CDU系统 ,提供液-液(Liquid to Liquid) 、液-气(Liquid to Air)等多种热交换方式,并提供支持机柜内安装 、落地式安装等多种型号 ,覆盖温度控制、流量控制、压力控制、流体处理 、热交换与隔离五大关键功能,为高密度人工智能集群获得更佳的制冷效果提供有效支持。不止于此 ,冷板式液冷CDU系统将为用户带来芯片性能和可靠性提升、能效更高  、占用空间更小 、总拥有成本更低、噪音更低等多项优势。

尽管液冷技术优势明显,但传统风冷对于较低机柜功率密度的小型AI集群仍是比较受欢迎的冷却方案 。汤熠指出,目前较为典型的风液比配置为3 :7,在短期内,液冷并不能完全取代风冷 ,部分非主流芯片的热量依然会由传统的风冷和风墙带走,而CPU 、GPU主芯片将采用液冷解决方案 。无疑,风液融合将成为行业发展的必然选择。

二)IMDC智能模块化数据中心,智算边缘部署全新路径

聚焦边缘AI多样化应用场景,以及各行业企业对数据处理低时延 、高效性的多样化需求 ,施耐德电气IMDC智能模块化数据中心交出了一份满意的答卷 ,以打通大模型“最后一公里” 。该解决方案集成了电源、配电、制冷、机柜 、环境监控管理等在内的物理基础设施单元 ,全部物理组件可在到达客户现场前实现工厂预制及全面检测,通过边缘控制层级的智能管理及数字化运维软件APP,帮助客户实现快速部署 ,实现端到端一站式交付和远程数字化管理 。

据介绍,IMDC智能模块化数据中心支持AI机柜的模块化部署 ,不仅可以在通道内做长度扩展,支持20个机柜一组,最大可延展到40个IT机组 。同时 ,用户可以采用微模块方式,用户可根据自身的智算需要 ,实现弹性扩容 。

值得一提的是,IMDC智能模块化数据中心基于AI加持的智能运维方式,集成2台算力服务器 ,支持每8秒判定内部环境情况 ,对内部空调温度等进行精准智能调控 。通过AI的主动干涉,空调能耗每年可下降30% ,实现能效与运维效率的双重提升 。

IMDC智能模块化数据中心部署了2米高的机柜屏幕 ,支持数字孪生的全景可视化 ,以满足相关行业与企业的量身定制需求 。用户可以在该屏幕上 ,查看UPS的状态、每一台空调的状态以及AIDC里面每一台服务器的状态 ,从而进一步保障资产安全性,并提升智能监控与运维能力 ,避免业务无关人员误操作导致训练中断。

三)供配电革新 :重新定义兆瓦级电力保障

随着AI应用场景不断拓展深入,供配电系统的要求日趋严苛 。施耐德电气Galaxy VXL UPS凭借在间利用率、功率密度和安全性能方面的三重突破 ,为各类AI场景大规模电力负载提供可靠保障。

在优化空间利用率方面 ,Galaxy VXL UPS实现了革命性突破,单机功率最高可达1.25 MW,其紧凑的设计仅占地面积1.2 m2,从而为IT负载的部署释放更多空间 。数据中心灰区(辅助设备间)和白区(IT机房面积)的占比可能由1:1演化为7:3,而Galaxy VXL UPS能大幅降低传统配电面积  ,提供更多的空间给到白区,适配智算中心需要。

为了更加直观地了解这些数据背后的意义,此处可以通过一组对比进行详细介绍。传统1MW以上的UPS占地面积基本都在4 m2以上,或是宽度基本在4m以上。Galaxy VXL UPS将占地面积减少了约70%,无疑为用户释放了更多宝贵空间用于IT设备部署。

此外 ,Galaxy VXL UPS率先突破了行业3U空间的功率模块极限 ,实现125 kW的更高输出功率,基于可扩展的模块化设计,Galaxy VXL支持4台UPS并机运行,在仅4.8 m2空间内即可实现5 MW的功率输出,客户可根据自身当前与未来发展需求,灵活增加电力模块  ,有效降低资本支出。

不止于此, Galaxy VXL UPS在能效突破方面同样表现出色。其在双变换模式下整机效率可达97.5% ,在E变换模式下系统效率高达99%。E变换作为施耐德电气率先提出的概念 ,历经长期实践验证 ,已经在全球多个地区广泛应用,客户使用率超过70% 。

针对高功率密度带来的散热挑战 ,Galaxy VXL UPS采用多极传导创新设计和动态气流散热设计 ,满载时可降低20%的散热量 。产品在0-40℃工况下可不降容运行 ,即使在50℃极端环境下,也能在满足一定负载条件下保持高性能运行。

连博表示,在着力提升UPS核心性能参数的同时  ,厂家更需要将“高安全可靠”理念贯穿产品全生命周期。为了保证工作人员在更换设备中的安全性 ,Galaxy VXL UPS具备在线插拔(Live Swap)功能 ,该功能获得了德国莱茵TÜV集团签发的全球首张Live Swap认证证书 。“在线插拔与市面上常见的热插拔有本质区别。” 连博强调,传统热插拔需要操作人员穿特殊的PPE防护装置 ,并经过严格培训才能操作,仍存在闪弧、拉弧、短路的危险。而在线插拔功能可以保证即使发生拉弧现象,拉弧能量也能被有效控制在1.2cal/cm²以下,从而确保在最大限度内保障操作人员安全 。”

以创新应对挑战,以合作共创未来

众所周知,面对AI时代带来的复杂性挑战,任何一家企业靠单打独斗无法满足客户的全方位需求。为此 ,施耐德电气积极与行业领导者建立战略合作,共同构建完整的AI就绪基础设施生态 。

在英伟达GTC巴黎大会上,施耐德电气宣布与英伟达深化合作 ,助力下一代“AI工厂”的建设和发展。此外,施耐德电气也与联想 、戴尔开展战略合作  ,合力布局智算产业 。从设施供电、制冷、IT机房等领域 ,为适配未来的智算中心提供更好的解决方案 。

在人工智能重塑世界的过程中,算力基础设施是这一变革的物质基础。施耐德电气凭借其在供配电 、制冷和数字化领域的深厚积累 ,从冷板式液冷CDU系统 、IMDC智能模块化数据中心到Galaxy VXL UPS ,为AI时代的数据中心提供了全面保障,更推动行业的技术进步和标准制定 。

这些解决方案不仅在空间利用率、功率密度 、安全性能等方面实现了突破,更通过模块化设计 、智能化运维和生态合作 ,为客户提供灵活性、可扩展性和可持续性 。

未来 ,随着AI技术从前沿探索走向规模化应用,施耐德电气将继续加大研发投入 ,深化与合作伙伴的关系 ,为全球智算基础设施的建设和发展提供更强有力的支持。

Tags:

相关文章

  • 端口扫描攻击检测及防御攻略

    数据库

    译者 | 晶颜审校 | 重楼端口扫描用于确定网络上的端口是否开放以接收来自其他设备的数据包,这有助于网络安全团队加强防御。但恶意行为者也可以利用这一过程来寻找易受攻击的端口。在深入研究什么是端口扫描攻 ...

    数据库

    阅读更多
  • win10待机后无法唤醒怎么办

    数据库

    在使用win10系统的时候,很多用户们表示在长时间不使用电脑,在电脑待机的时候,无法唤醒了,只能重新使用电脑电源键来重新的开启电脑,这个问题是怎么导致的呢,快来看看详细的教程吧~3、然后选择【系统】进 ...

    数据库

    阅读更多
  • WIN7怎么升级到WIN10系统版本

    数据库

    自2020年1月14日开始,微软宣布正式停止对win7系统的支持,那么以后将不会对win7系统进行安全修复和更新。而继续使用win7系统将会极大的增加病毒和恶意软件攻击的风险,小编建议更新win10系 ...

    数据库

    阅读更多

滇ICP备2023006006号-40