AI浪潮录丨人工智能为什么是年轻人的事业？专访95后师天麾

开栏语

当人工智能的浪潮席卷全球，北京正以科技创新之姿，成为AI大模型领域的战略高地。从智源研究院的“悟道”大模型问世，到“天使投资人”模式孵化顶尖学者，再到月之暗面、DeepSeek、智谱等人工智能独角兽崛起，这座城市不仅汇聚了前沿技术，更以开放生态孕育突破性成果。

如今，北京正积极打造“全球开源之都”，一大批研发机构、企业积极拥抱开源，而开源也已深入到汽车、机器人等众多行业。发展AI将是一场科技长征，新京报AI研究院将深度访谈此次AI浪潮的亲历者与见证人，讲述AI竞争新格局与背后的故事。

清程极智联合创始人师天麾。受访者供图

人工智能是年轻的事业，也是年轻人的事业。

清程极智联合创始人师天麾正成为这句话的一个生动的注脚，而他的经历也是当前中国年轻一代AI高端人才的缩影——高中拿下信息学奥林匹克竞赛金奖保送清华大学，大学确定了系统和高性能计算的研究方向，博士毕业后成为中国科学院计算技术研究所课程讲师、中国信通院万卡智算集群服务能力推进方阵技术专家。

多个身份标签加持，互联网大厂曾向师天麾抛出高薪的橄榄枝，他最终却选择自己创业，理由也很简单，“做一些不同的事”。在他眼中，大厂“老板安排”和KPI均是束缚，创新将难以开展。

在AI圈，年轻的身影已然显眼。2024年异军突起的Kimi由90后杨植麟领军，2025年席卷全球的DeepSeek核心团队成员为清北的应届毕业生组成。根据猎聘大数据研究院报告，近一年AI技术活跃人才中，30岁以下的人才占比59.90%。

如今，创立一年多时间，清程极智已同时入驻上海“模速空间”和北京“人工智能创新街区”，这个清华系AI Infra（人工智能基础设施）创新企业，员工平均年龄不到30岁。

作为一名95后，师天麾的身上看不到老一辈人心中那座名为“技术差距”的大山。面对新京报AI研究院关于算力、创新等问题时，师天麾坦言，英伟达从建立起CUDA到很多人用，其实也没有很久。国产芯片只要解决好更好用的问题，以国内的工业制造能力，将以超高性价比在竞争中胜出。

他所在的这支由清华计算机系师兄弟组建的团队，既是中国AI新生代的典型样本，也是破解国产算力短缺的探路者，开源的大模型推理引擎“赤兔”通过底层技术革新，实现了大多数老旧英伟达GPU和国产芯片对原生FP8模型的高效部署，从而能够运行DeepSeek满血版。当全球AI竞赛进入算力攻坚阶段，年轻团队正在为国产芯片与大模型之间架起一座“通天塔”，在英伟达主导的算力版图中撕开一道创新裂缝。

创业·代码写得特别快的愉悦

新京报AI研究院：你最早接触AI是什么时候，为何选择了这个行业？

师天麾：我最早接触AI要追溯到初高中加入信息学奥林匹克竞赛小组的时候，当时的学习内容主要为“算法和数据结构”。之所以学习奥赛，主要是对计算机感兴趣，还能偷偷打游戏。高二的暑假，我获得了2014全国青少年信息学奥林匹克竞赛金牌，保送了清华大学计算机系。

在我的大学期间，人工智能已经迎来了以智能驾驶和CV（计算机视觉）为主的第一波浪潮，大二时，我还没想好将来是就业还是从事科研，于是去了智能驾驶企业Momenta实习研究算法。经过工作实践，我发现人工智能算法的“黑箱”特性导致可解释性不强，这无法给我很高的成就感。大三时，我去商汤科技的高性能计算部门进行了尝试，才找到了自己真正的兴趣所在。

实际上，信息学奥林匹克竞赛本身就对程序运行的时间有要求，这也让我对“把一份代码写得特别快”很感兴趣，最终我成为清华大学高性能计算研究所翟季冬老师的博士。在博士研究过程中，多年积累也为创业提供了条件。2023年，我们清程极智成立，主要以清华计算机系高性能计算所的师兄弟为班底，清程主要做AI Infra。

简单来讲，AI Infra是连接硬件与AI算法之间的“中间层”，通过我们的软件，客户可以在相同的硬件资源上实现更快的推理速度和更高的并发性能，实现AI应用落地更高效、更低成本，让国产硬件也能“比肩”英伟达。

新京报AI研究院：清程极智的员工非常年轻，团队为何是这样的组合？

师天麾：我们团队30岁以上的人很少，只有三名80后。年龄最大的为1985年出生，最小的则是一名已经保送清华的高三实习生。相比学校更侧重理论基础学习，企业可以真正让理论学以致用。当我们把一个实际问题足够细化，最后就会变成一个题目，交给这名高三实习生后，他用一两天时间就做完了一周的工作，并且反馈说终于明白了在学校学习的计算机理论基础“有什么用”。

我们团队年轻的原因一方面是所在的行业比较热门，团队技术背景也很好，对同学们挺有吸引力的，所以一些刚出校门的同学就加入清程了。另一方面，其实AI Infra研究相关职位并不好招人，相比算法，我们的工作更加偏向底层，圈子“就这么大”。所以，我们也愿意招一些有想法、有热情、基础扎实、学习能力强的年轻人进行培养，有些甚至是在校生。同时，AI行业本身也比较年轻，有些担起重任的技术大佬也是95后甚至00后，也就是互联网原住民一代。

新京报AI研究院：从你进入清华到现在，已经过去了十年，这期间AI技术已经经历了至少两轮浪潮，对此有什么感受？怎么看待热点变化对学生选择专业的影响？

师天麾：当我决定走高性能算力这条路时，技术热点的变化对我就影响不大了。因为不论是CV、大模型，还是再往前的云计算、超算，哪一项技术火爆，只要用的人多起来，成本在一定程度上就会变高，都需要通过高性能计算来加速、降本。

入校时火爆的热点，可能毕业时不一定再热。但学生只要打牢基础，无论未来什么热点火爆，高性能计算的能力都可以很好地运用进去。

商机· 从训练转向推理，踩点DeepSeek爆火

新京报AI研究院：今年1月底开始，DeepSeek爆火，作为从事算力研究的AI Infra公司，你们受到了怎样的影响？

师天麾：春节期间打开手机，朋友圈到处都是DeepSeek的消息。很多去年和我们合作的国产公司开始密集和我们探讨怎样快速适配DeepSeek。春节期间，我们和这些公司几乎每天都在沟通。

DeepSeek采用MoE（混合专家模型）架构，我们在前几年MoE刚出现时就判断它会成为未来的重要趋势，因此进行了MoE模型训练、推理加速的技术积累，也发表了一些国际顶级会议的论文。

清程极智的客户生态主要包括硬件厂商、大模型研发企业以及有数字化转型需求的企业。去年，大模型训练的需求高于推理的需求，但随着DeepSeek出现，企业对推理服务的需求正超越传统的训练需求，而我们推出的DeepSeek一体机以低技术门槛，让企业在无需专业AI团队支撑的环境下也能部署并使用大模型，作用类似于AI领域的“傻瓜相机”。

我们做推理的优势很大，因为DeepSeek需要多机器推理，涉及上层并行计算的优化，这方面我们有面向超大规模国产算力集群研制的大模型训练系统“八卦炉”，计算能力已扩展到10万台服务器超大规模集群，所以在多机并行计算、通信优化等方面经验丰富，将这一数量级的集群优化经验放到几台机器上，做起来非常顺手。

目前，我们的一体机产品部署较多的模型主要有DeepSeek、智谱GLM 、Qwen和llama等主流模型。

新京报AI研究院：发展大模型，算力是一个绕不开的话题。英伟达在这一领域经营多年，甚至衡量一家企业的算力往往是看其拥有多少张“英伟达卡”。你的发展愿景会是成为下一个英伟达吗？

师天麾：相比于成为英伟达，我们的定位更类似于帮助国产芯片比肩英伟达。让国产芯片以及老旧英伟达芯片的能力达到和英伟达新版芯片一样。今年初，清程极智与清华共同开源了大模型推理引擎“赤兔”（chitu），通过赤兔的部署，让英伟达老卡旧卡及国产芯片可以支持FP8精度模型，从而能够运行DeepSeek满血版。下一步，我们也将尝试让CPU服务器也能高效运行大模型。

当前，国产硬件正在慢慢变成熟，但这需要一定的过程，比如我们在使用国产硬件时会发现一些底层Bug，此时我们会和对方进行反馈。

其实，英伟达从建立起CUDA生态到很多人用，时间上也没有很久，其崛起的主要因素是赶上了GPU适配AI训练推理的技术红利期。所以归根结底，这还是国产生态的问题——不一定需要一味在硬件上追逐赶超，通过软硬协同一样能让国产显卡更好用，以我国在工业制造领域强大的产业化能力，参照手机、汽车等行业的演进轨迹，完全具备在合理周期内实现显卡产品的性价比突破。

当前，很多央国企已批量采购国产显卡设备，但实际部署时仍依赖海外推理引擎，而部分前瞻性客户已启动专项采购流程，将国产推理引擎纳入采购流程，这标志着市场对纯国产技术栈的认可度正在提升。

当前，DeepSeek的出现证明国产大模型已经不输世界一流模型了，如果不用上同样好的国产显卡和推理引擎，生态就不完整，只有生态好，算力国产化的目标才能更好实现。

我们的最终目标是：不管底层的硬件是什么，只要通过我们的软件引擎，都能够感受到相同性能的算力服务，规避掉硬件的差异。

抉择·KPI压力带不来创新

新京报AI研究院：DeepSeek的团队也很年轻，你怎么看待DeepSeek在创新方面的成功？

师天麾：DeepSeek做得很好，原因之一当然是他们招揽的人才非常厉害。我们组博二和博三的同学全部收到过DeepSeek的邮件。相比大厂，DeepSeek少了一些KPI的压力，更类似于学校里博士从事的科研工作，即“找一个有意思的点，尽量去实现。做一件有意义的事情，但不要求给我带来多少收益”。

一旦有了KPI的压力，往往就不敢去做收益不确定的事情，会更加倾向于复制已有的、明确的路径，这不会冒险，但也做不出“特别不一样”的东西。

新京报AI研究院：以你自身的经历来看，AI相关专业毕业生在初创企业、大厂与学校科研之间如何抉择？在企业的经历和实验室有何不同？

师天麾：我博士毕业后，就已经有大厂发来了薪资很高的offer，但我当时更倾向于创业，做一些不同的事。在大厂，大多情况下是“老板安排什么就做什么”，同时要背负一定KPI，如果被这些东西束缚住，可能一些事情将难以开展。当初如果我选择了大厂，可能也会先待两三年熟悉产业界，有了经验再出来创业。对于大厂来说，“你就值这个钱，你必须做这件事才能发挥价值。”

在清程极智，我们基本很少加班，氛围开放并不“内卷”。我们对自己的技术非常有信心，我们相信，顶级的技术人员不是逼着加班就能释放出生产力的，最重要的是不受限制的创造力。

对于学界与企业的区别，学校的实验室会更多地从技术角度分析一件事，比如大模型训练推理系统的性能瓶颈在哪里，如何解决使其加速。在学校，1万行代码就能验证一个想法，但要把这个想法变成可用、稳定、几乎没有Bug的产品，可能需要几十万代码。这就是企业要做的，对于企业的产品，性能好并不代表绝对好用，需要更多权衡，更多产品工程化。

同时，实验室对于投产比没有那么在意。企业则需要向投资人交代，试错成本不能太大。最后，二者的节奏也有所不同，企业需要看市场上客户真正需要什么，要从用户角度来考虑市场的变化，并进行积极地适配。

记者联系邮箱：luoyidan@xjbnews.com

新京报贝壳财经记者罗亦丹

编辑王进雨

校对杨许丽

本文分类：实时讯息
本文标签：英伟模型新京报企业研究院技术人工智能清华
浏览次数：0 次浏览
发布日期：2025-05-09 08:51:00
本文链接：https://m.ypwz.net/news/42bPoGoxJn.html

栏目导航

AI浪潮录丨人工智能为什么是年轻人的事业？专访95后师天麾

纸品售价下降，阳光纸业上半年净利预跌至多65% 此前收购的全资子公司亏损加剧

如何让老年人适应人工智能社会？这群深圳中学生脑洞大开

直击WAIC 2025 | 让大模型算力像电力一样随处可得？后摩智能CEO吴强：端边大模型机会巨大

清廉典故进机关首场展演活动在济南举办

提升服务质效 助推产业发展 武晓花调研小店区经济社会发展情况

中国数字“智造”为上合国家产业转型贡献智慧

提升服务质效助推产业发展武晓花调研小店区经济社会发展情况