中国智算如何实现“DeepSeek式突围”

今年以来，我国以DeepSeek为代表的大模型企业通过算法优化、有针对性的训练和开源生态协作，在使用“缩水版”GPU芯片的情况下，将千亿参数模型训练成本压缩至同类模型的1/10，走出了一条从粗放式算力堆砌向内生式效能提升的新路径。

在全球惊叹中国非对称创新奇迹的同时，也要清醒看到，就人工智能（AI）技术和产业自主可持续发展而言，我国仍未摆脱对高端乃至“缩水版”智算芯片等物理器件的依赖。在可以预见的未来，外部环境可能更趋恶劣，封锁遏制常态化、供应链不确定性等挑战难以回避。我国亟需在智能算力层面实现“DeepSeek式突围”，用超限创新解耦当前硬件算力提升与制程工艺进步强绑定的关系。

换言之，我国要在AI领域获得与竞争对手可博弈的能力，不仅要在算法层面继续革命、突破“算力茧房”，而且要在算法与物理层面深度融合上实现换道超车，破解“制程工艺茧房”。以生成式变结构计算、软件定义晶上系统（Software defined System on Wafer，SDSoW）为主要内容的晶上生成式体系架构，为解决算法模型与算力载体失配难题、增强软硬件协同算力可持续发展提供了新的技术路径。

让计算架构的“鞋”适应算法的“脚”

先进的芯片制程工艺能够提供更高的晶体管密度，提升芯片单位面积计算能力，为大模型训练和推理提供更强大的计算资源支持。然而，基于还原论的工程设计范式，芯片制程工艺艰辛迭代获得的物理算力提升，很难被大规模分布式物理系统上运行的软件算法有效利用。芯片峰值计算能力与算法系统性收益存在结构性错位，加之分布式系统在技术体制上受“大规模、低时延、高带宽”不可能三角问题制约，靠简单堆砌千张、万张乃至十万张以上GPU卡的方式，难以满足“规模定律-Scaling low”驱动的大模型训练之非线性算力增长需求。

简而言之，由于存算分离体制的冯·诺依曼计算架构，硬件系统设计（如芯片制程、内存带宽、并发单元等）与算法模型的运算特征（如计算密度、数据流模式、精度需求等）之间存在系统性错位。即便芯片制程工艺有所进步，带来了性能增益，也会由于“逐级插损”的系统工程范式大打折扣。

突破“制程工艺茧房”，在更高维度上寻求问题的解空间，需要变革传统刚性计算架构及技术物理实现范式。

近80年来，传统计算架构一直沿用运算器、控制器、内存储器、输入输出设备几大件组成的冯·诺依曼计算架构。无论是复杂的AI算法，还是简单的数据处理任务，都被“硬塞”进刚性的计算架构之中，奢望“一劳永逸”地处理千变万化的应用。这就好比不管你脚多大，都必须穿37码的鞋才能走路。然而，鞋不合脚就走不快：小脚穿大鞋会绊脚；大脚穿小鞋则会感到疼，结局往往是“削足适履”。

化解刚性架构算力与多样化算法间结构性矛盾，需要借助物理学增维求解法则，导入自适应计算架构新机理。

2009年，受“自然界伪装大师”拟态章鱼启发，中国科学家在世界上首次提出领域专用软硬件协同变结构计算——拟态计算。如同拟态章鱼，可“随机应变”地隐匿在沙质海底或珊瑚礁等环境之中，拟态计算能让“鞋子”更好地适配穿着它走路的“脚板”。

2018年，计算机体系结构大师、图灵奖得主大卫·帕特森和约翰·轩尼诗预言，基于软硬件协同计算语言的领域专用软硬件协同计算架构，将成为今后十年计算机体系架构黄金发展期的主流发展方向之一。前不久，特斯拉Dojo超算公布了其计算范式变革的解决方案，提出硬件架构像变形金刚般随任务变形，实现从“算法适应硬件”到“算法定义硬件”的范式转换。

用二流零部件构建一流系统

生成式变结构计算的核心在于按算法需求动态重构计算架构，要求算力的硬件载体能够实现以软件驱动物理结构变化，大幅度提升特定计算结构对特定算法的执行效能。SDSoW就是要推动计算架构从“刚性流水线”向“软件可塑形”跃迁，打通生成式变结构计算从理论到技术物理实现的闭环，使得基于二流器件或部件构建一流系统成为可能。

具体来说，SDSoW具备五大能力。

一是系统破局能力。SDSoW摆脱“核心器件决定论”思维，改变“芯粒、芯片、模组、机匣、机架、系统”的逐级堆砌、逐级插损式工程技术路线，通过晶圆级异构集成实现功能解构—晶上重组，达成功能等价、系统最优的目标，将制程工艺短板通过系统工程方法转化为非主要矛盾。

二是整体增效能力。借助晶圆级高密度互连、超短距离、异质异构封装，获得高带宽、低延迟、低功耗的系统增益，SDSoW系统的带宽可提升一个数量级，时延可缩小一个数量级，功耗可降低一个数量级，系统效能可提升三个量级。

三是通专融合能力。基于晶圆级系统硬件可编程/重定义架构，可通过软件实时配置或由AI大模型生成SDSoW功能和性能。在同一物理载体上，能根据不同应用需求或使用场景，实现“一平台、多样性”生成式变结构计算，既可满足专用场景特殊算力需求，又能兼顾领域内相对灵活的通用算力要求。

四是开源协同能力。通过建立SDSoW开源社区，发布基础互连协议、动态控制器及生成式变结构计算工具链等，SDSoW可构建“中国引领、全球参与”的生态环境，以开放破垄断，形成相对Chiplet（小芯片）路线的比较优势。

五是内生安全能力。SDSoW可从源头上应对开放生态带来的新域新质安全挑战，通过引入内生安全架构实现开放可控，即便供应链欠安全，仍能保证开放条件下该系统具有“开箱即用、默认安全”的网络弹性。

总之，晶上生成式变结构计算可为我国打破算力芯片“制程工艺茧房”开辟新路径，走出一条用“三流材料、二流工艺”达成“一流能力”的系统工程级创新路线。通过应用与设计、算法与算力的垂直整合，解耦当前我国算力基础设施产品对芯片先进制程工艺的强依赖关系，最大程度获取体系结构与工艺进步的综合增益。晶上生成式变结构计算也能为全球智算普惠提供中国方案。

基于晶圆级集成/封装的生成式变结构计算，开辟了算法架构突破与物理载体革命、算法工程实现与计算范式创新深度耦合的新方向。目前，应尽快推动根理论突破，重点攻关晶上热力学、异构集成理论、可重构架构数学描述等底层理论；持续加强根技术攻坚，突破晶圆级键合、3D互连、晶圆级操作系统、生成式结构计算语言/编译器等关键技术，实现从架构设计、物理实现到技术应用自主生态；多维推进根产业培育，以智能驾驶、具身智能、工业数字孪生、AI一体机等新兴市场需求为牵引，通过“场景开放+体系创新+生态聚合”三位一体模式，以超限创新、超常规举措突破“小院高墙”“遏制封锁”，蹚出一条中国特色技术平权和产业可持续发展之路。

（作者：邬江兴系中国工程院院士）

来源：科技日报

本文分类：实时讯息
本文标签：架构算法芯片系统结构制程工艺范式
浏览次数：0 次浏览
发布日期：2025-04-02 14:53:00
本文链接：https://m.ypwz.net/news/V7x8zeQLrD.html

上一篇 > 民生银行天津分行创新小微融资服务机制精准破解企业融资难题
下一篇 > 89岁院士苏定强，在南京捐出150万奖金

栏目导航

中国智算如何实现“DeepSeek式突围”

对话云天励飞陈宁：全面聚焦AI芯片，迎接AI“推理时代”

直击WAIC 2025 | 让大模型算力像电力一样随处可得？后摩智能CEO吴强：端边大模型机会巨大

阿里云ESSD同城冗余云盘正式商业化，同城容灾成本可降低50%

在成都，创未来｜创业不到十年，他们让机器人拥有“灵魂”，走上蓉城街头

甘肃省档案馆引入AI技术提升数据治理水平

谷歌酝酿为安卓推AI通知摘要功能：仅总结对话内容