如今人工智能在千行百业的大放异彩股票配资查询平台,说到底是开放生态与开源应用共同作用的结果。
随着云计算、AI和芯片技术的快速发展,传统计算架构面临性能、能效和成本的多重挑战,而依托开放开源生态、通过协同开发实现技术创新突破,就成为了产业界的共同目标,进而也推动了硬件标准化与模块化创新——就比如OCP的开放服务器设计已被全球云服务商大规模采用,显著降低数据中心TCO。由此看来,开放开源不仅加速了异构计算、液冷技术等前沿方案的落地,更通过社区协作形成事实标准,避免单一厂商锁定。
日前,在北京举行的2025年开放计算峰会(OCP China Day)成了一个璀璨生辉的行业风向标。大会由开放计算社区OCP及开放标准组织OCTC(中国电子工业标准化技术协会开放计算标准工作委员会)联合主办,以“开放变革:筑基、扩展、进化”为主题,也吸引了超千位知名学者、技术专家、应用开发者及厂商代表共同参与。
作为大会的重要环节之一,现场还颁发了“开放计算生态共享奖”,当阿里云代表从组委会手中接过奖杯时,现场响起了热烈的掌声。这一荣誉不仅是对阿里云技术实力的认可,更是对其在构建全球开放计算生态中所作贡献的高度肯定。作为中国云计算行业的领军企业,阿里云近年来在超节点Scale Up互连技术领域的突破性进展,正在重新定义AI基础设施的架构和发展方向。
本次开放计算峰会上,阿里云基础设施异构硬件和系统资深总监卢晓伟在主题演讲中说:“开放协作是技术发展的必然选择。超大规模MoE带来了AI基础设施的算力、互联、能耗瓶颈,以及可靠性和稳定性的挑战,需要为AI重构算力系统,开放的Scale Up超节点架构将成为核心发展路径”。
从技术标准到商业实践,从中国市场到全球舞台,阿里云正在通过开放生态战略重新定义AI基础设施的未来。这个开源生态贡献奖,既是对过去成就的肯定,更是对未来发展的期许。在AI算力需求爆发式增长的今天,开放、协作、创新将成为行业发展的主旋律,而阿里云在这场变革中彰显引领者的影响力。
重塑AI计算互连格局标准,UALink一马当先
在AI计算领域,高性能GPU之间的互连技术一直是大规模训练集群的关键,而今年大火的超节点AI基础设施解决方案也体现了这一点。就技术层面来说,业界已有的XXLink虽然性能优异,但其封闭的生态体系使得客户难以灵活选择和设计更符合应用需求的系统架构;尤其是在当下复杂的国际形势,如何实现多层面的安全、稳定、可靠也成为了各大企业创新发展的核心焦点。
这一背景下,由阿里云、AMD、英特尔等共同推动的UALink(Ultra Accelerator Link)开放联盟和互连协议应运而生,由此也为行业带来了新选择、新道路。作为一项新兴的互连协议,UALink联盟通过定义国际开放协议和生态建设来推动AI服务器Scale UP互连技术的发展,UALink协议以其原生内存语义访问、显存共享、以及超高带宽和超低时延等特性,成为AI超节点Scale UP互连技术发展的新动力。
具体说来,UALink技术的核心突破体现在两个维度:首先是其革命性的性能表现,UALink定义了一个开放、极简的基础协议,专为支持机架规模(Rack Scale)AI工作负载而设计——UALink 1.0支持连接多达1024个加速器(2.0的节点规模将远超1K),覆盖1到4个机架规模,单lane双向带宽达200 G/s,单端口带宽可达800 G/s,端到端百ns级极致延迟,原生支持内存语义,高效实现加速器直出互连的需求。
其次是其开放架构设计,通过层次化的标准协议实现了多厂商设备的互连互通,用户可以根据需求自由选择硬件组合,彻底摆脱了单一厂商的技术束缚。特别值得一提的是,UALink 1.0的物理层可以复用IEEE 802.3定义的112/224G PHY。这一设计理念不仅加速了技术落地,提升系统稳定性,更将整体部署成本大大降低。
协议开放、技术开源,是UALink在业界大火的最重要原因之一。而作为UALink联盟董事会中唯一的中国企业,阿里云作为在这一开放协议的演进过程中扮演着关键角色。早在去年9月的云栖大会上,阿里云发布的磐久AI Infra 2.0服务器成为了展示UALink技术优势的最佳实践平台。这款划时代的产品单柜支持64-80个节点,提供了极致的PB级共享显存和TB级互连带宽。
今年1月,阿里云正式加入UALink联盟董事会,随即推动成立了中国技术工作组,支持协议的本土化适配和推广。三个月后,阿里云代表UALink联盟与ODCC(开放数据中心委员会)签署战略合作协议,推动该标准在中国超大规模数据中心的落地应用。
落地中国市场,ALink System构建生态基石
如果说UALink是世界性的开放技术规范,那么ALink System(加速器互连系统,ALS)则是为中国市场量身打造的开放生态体系。2024年9月,阿里云倡议并推动ODCC(开放数据中心委员会)成立了ALS开放生态系统,推动国内的Scale Up行业生态发展,通过开放协议和技术开源赋能AI基础设施的演进。当前ALS已取得了阶段性成果,目前已有数十家AI芯片、互连芯片、服务器整机硬件和IP设计厂商加入,成员单位已就相关协议制定和实行路径开展多次交流并获得相应进展。
在此次开放计算峰会的开放系统设计论坛上,来自阿里云超高速互连负责人孔阳博士也表示,ALS生态的核心价值在于促进了广泛的生态共识:首先,围绕Scale Up的极致性能和原生内存语义的特性,各公司对于协议和系统形成了深入的共识,作为AI基础设施的核心技术,需要围绕新型协议和硬件架构进行建设;其次,对于开放Scale Up行业开放生态建设的完备性进行最后推进,形成端到端产业生态布局,其中涵盖物理层Serdes、IP控制器、IO Die、GPU芯片、Switch芯片、硬件连接器、板卡及系统设计;最后,全面兼容国际开放协议UALink的生态,ALS可以与行业伙伴开放共建超高性能、超大规模的Scale UP集群互连能力,当前一级互连64~80个节点,二级互连可达千级节点,提供PB级共享显存和TB级互连带宽,未来将支持更大集群规模。
如今,UALink与ALS的协同发展,这一方面标志着国内Scale Up技术和生态进入全球领先水平,另一方面二者也通过技术互补、生态共建和标准开放,正在重塑全球AI 基础设施的竞争格局。未来,随着光互连等更多技术的融合,以及开放生态的持续扩张,UALink 与ALS 有望成为推动AI 产业下一个十年爆发的核心引擎,而阿里云作为行业领先的AI技术设施提供商,持续引领着行业发展。
CXL互连,赋能行业新型业务竞争力
一直以来,阿里云在CXL互连方向上的研发也走在行业前列。在此基础上,阿里云形成了支持CXL的通用计算服务器、CXL Switch软硬件系统、Alimemory(CXL Memory)、AliSCM(CXL Pmem)、Memory Box等较为完整的产品布局,并通过这些产品支撑起弹性,可编排的磐久服务器方升机柜级CXL池化架构,实现了对开源应用、开放架构的全面拥抱。
就在两个月前,数据库国际学术顶会SIGMOD 2025上,阿里云凭借PolarDB云原生数据库与CXL Switch的分布式内存池技术进行结合的全球首创架构,斩获工业赛道“最佳论文奖”。而这其中核心内存池系统PolarCXLMem,正是构建于阿里云磐久CXL内存池化自研硬件平台之上,CXL的引入不仅是一次接口替换,更带来了数据库系统设计的根本性革新。
磐久CXL内存池系统支持10TB内存容量,具备百纳秒级端到端访问延迟与数TB/s的吞吐能力。磐久CXL内存池系统加持下的PolarDB DMP各方面性能相对传统RDMA架构得到全面提升,Pooling场景,性能提升至3.3倍,Sharing场景8节点与12节点集群性能分别提升68.2%与154.4%。
特别是随着AI大模型应用逐步落地,推理将占据绝大部分的智算算力,而成本则是AI商业模式是否可持续的关键。在这种场景下,基于CXL扩展内存池及异构存储分层提供多级存储池化能力,实现KVcache在多级存储分层间高效共享流动,构建出满足TTFT及TPOT等关键SLA指标且更加经济高效的推理解决方案也正成为业界热门研究方向。就在此次峰会的开放计算生态论坛上,来自阿里云资深技术专家常存银表示,基于阿里云朱雀智算存储软硬一体平台,针对推理应用方向中多种客户场景优化:如多轮对话,RAG知识库,PD分离等应用需求,实现了显存容量的灵活扩展与计算资源的高效解耦,提供KVcache分层存储及共享能力,通过分布式池化管理,动态多级存储,以及互联扩展的能力满足推理业务场景高并发、低延迟的需求。
布局芯片级互连技术,阿里云助力UCIe软件生态建设
除在AI基础设施服务器层面布局之外,阿里云也持续向技术底层深入探索,积极投身于芯片级互连等前沿领域。例如,阿里云在通用芯粒高速互连技术联盟(Universal Chiplet Interconnect Express, UCIe)中表现活跃。近年来,基于Chiplet(芯粒)合封的芯片设计和先进封装模式,因其在5nm及更先进制程工艺下能显著改善芯片良率,降低成本并支持模块化设计复用,被业界广泛视为应对后摩尔时代挑战的关键技术路径之一。UCIe联盟的目标正是致力于构建开放、可互操作的芯粒互连标准,推动芯粒合封技术生态的成熟和繁荣。
在谈到对UCIe组织贡献的时候,CXL和UCIe董事会成员、阿里云智能集团首席服务器架构师陈健表示:“阿里云是大陆厂商中在Chiplet 领域布局最早的公司,也是UCIe 唯一来自中国大陆的董事会成员,在UCIe 的生态建设和推广方面做了大量工作。在推动UCIe 生态成熟以及基于Chiplet 设计的实际方法论方面,阿里云与上下游伙伴密切合作,致力于实现更加开放且稳定的芯片供应链模式。”
在与业务场景相关的软件生态层面,阿里云也进行了前瞻性布局。为了支撑片上异构的多处理器并行计算,阿里云打造出了“震旦异构计算开放平台(HALO/ODLA)”。该平台提供可裁剪可扩展的轻量级接口,具备极少的内存占用和原生异构并行计算能力,非常适用于异构芯粒加速系统的软硬协同计算。时至今日,震旦平台已经获得了包括英特尔、UIUC等研究者的认可,也走出了一条有别于传统优化的新道路。
据行业知名公司贝恩咨询发布的《2024年全球高科技行业报告》显示:AI软硬件市场预计将以40%至55%的年增长率持续增长,到2027年市场规模将达到7800亿-9900亿美元。这一趋势也解释了行业发展的三大规律——技术融合方面,Scale Up和Scale Out的界限正在模糊,混合互连架构成为主流选择;区域发展方面,中国凭借ALS等本土生态的建立,正在形成独特的技术路线;可持续发展方面股票配资查询平台,能效指标已经成为方案选型的核心考量因素。
慧智优配提示:文章来自网络,不代表本站观点。