1.2万亿！清华教授，挑战美国最强AI，一战封神,清华教授是谁

6月22日，智谱AI继续股价大涨，盘中市值一度飙升到1.2万亿港元。

一家年营收仅7亿的公司，凭什么让投资者陷入疯狂？

答案藏在一场AI范式革命里。

2026年6月12日，美国政府一纸禁令，Fable 5没了。上线才三天，全球下架，官方给出的理由是：

国家安全。

跟之前的大模型不一样，Fable 5不只会聊天。

它更像一名数字员工，能操作你的电脑，自己规划任务，写代码、跑测试，修bug。更恐怖的是，它能把一个专业团队干两月的活，一天就干完了。

这并非天方夜谭。

来自美国宾夕法尼亚大学的测试，Fable 5仅用20分钟，就复刻了著名游戏《我的世界》。

大模型的战场，正从能聊天变成能干活。谁能让AI真正干活，谁就拿到下一张入场券。而美国人，似乎又领先一步。

网上弥漫着一种焦虑，很多人在问：中国大模型，是不是又被甩开了？

关键时刻，清华教授出手了！

Fable 5刚下线没几天，6月17日，一家叫智谱的中国大模型公司，就宣布GLM-5.2全量开放。

GLM-5.2有多厉害，它能扛住Fable 5吗？先看一组数据：

在全球权威的AI编程能力评测榜单Code Arena上，GLM-5.2以1595分排名全球第二，第一是已经下架的Fable 5。

换句话说，在还能用的大模型里，它排名第一。

网友们直呼疯狂，Arena官方则表示，这是一个令人难以置信的里程碑。

这意味着，国产开源大模型在Coding这件事上，首次跻身全球御三家：Claude、OpenAI和智谱。

在此之前，这个位置一直是谷歌Gemni的。

GLM-5.2并非一夜逆袭，它的背后，是一位闷头坐了13年冷板凳的清华教授。

他，叫唐杰。

2024年底，DeepSeek R1横空出世，全球都在喊：中国AI的DeepSeek时刻。大模型行业一夜变天。

就在很多人还在拼参数、拼价格、拼下载量时，清华大学计算机系教授、智谱首席科学家唐杰，却做出一个惊人判断：

Chat这一仗已基本打完了！

在他看来，Chat这个范式快到头了，边际收益正急剧下降，剩下的更多是工程和技术上的问题，而非颠覆性的范式创新。

下一个范式也许是让每个人都能用AI做一件事，聊天不是终点，干活才是！

那什么才算是干活呢？最自然，也是水到渠成的一个方向，是写代码（Coding）。

理解代码库、跨文件追bug、跑通测试，一个模型如果能自己写代码，它就能自己规划、自己执行、自己纠错。

某种意义上讲，它就是一个能干活的智能体。

唐杰很笃定，但团队内部还是为此争论了无数个夜晚。最终，由唐杰拍板，将所有精力投入到Coding领域。

这不是他第一次押注。更早的时候，GPT-3横空出世，智谱要做一个决策：做不做千亿参数大模型？

唐杰很清楚，如果要做，一旦失败了，就可能把公司送进坟墓。

但明知道有风险，他还是决定死磕。

在公司内部决策会上，他的表态一锤定音：如果成功了，那至少证明中国的大模型公司，技术能力也能达到世界级水平。

他不是没犹豫过，只是犹豫完了，还是选择继续死磕。

2021年，智谱从济南超算租了1000张A100卡，从底层重构算子，训练了8个月。

彼时，作为智谱AI的孵化方之一，整个智源研究院也只有480张A100，智谱的投入可谓大手笔。

到2022年7月，智谱训练出GLM-130B，总投入600万元。

当OpenAI烧掉近3000万，终于踹开人类第一扇千亿大模型大门时，唐杰团队靠着极致的工程优化，以远低于对手的成本，砸出中国首个开源千亿大模型。

这种判断力不是天生的。

2006年，唐杰清华博士毕业，大公司开出几倍薪酬，国外大学给了offer，但他还是选择留校搞科研。

促使他做出这一决定的人，是王选院士。

他想效仿王选以教授身份推动技术创新与产业化。

就在唐杰毕业前夕，2006年2月，王选老先生驾鹤西去，唐杰的选择在冥冥中化身为一种传承。

彼时，全球论文数量已经达数亿篇，但论文背后的规律却没有人去总结。

唐杰试图开发一款叫AMiner的工具，用AI挖掘全球学者的论文和合作关系，建一张学术界的地图。

那年头，没人关心学术工具，热钱涌向电商和游戏，他一做就是13年。

13年里，互联网首富换了好几茬。唐杰在清华的办公室里，带着学生一篇一篇论文抠。

这段苦行僧般的经历，虽然没有给唐杰带来财富，却磨出了他对大规模数据、对AI的判断力。

这种判断力，花钱买不到，赶工赶不出来，只能用时间熬。

2019年，唐杰带着清华KEG实验室团队，创立智谱时，AMiner十几年积累的底色，直接成了它的技术地基。

也正是凭借这种判断力，他敢在公司初创、生死未卜时，顶住压力，砸下真金白银，训练出中国最早的千亿大模型。

后来，当全行业陷入拼参数、拼价格的内卷泥潭时，他再次抽身，把下一代研发资源集中压在Coding这个更难，但也更接近AGI的方向上。

很多AI公司从第一天起，目标就很清晰：做产品，做应用，做用户。

但唐杰不是。

他做智谱，从一开始就没把大模型当聊天工具。在他眼里，大模型的终局不是对话，而是AGI，是能替代人干活的智能体。

▲图源：腾讯科技

这条路一开始就不轻松，因为它意味着：不做爆款应用，不抢流量入口，不追短期增长。只做一件事：

把智能往前推。

智谱的核心团队结构，也从一开始就写进了这种选择。

唐杰担任首席科学家，负责技术方向；张鹏担任CEO，负责商业落地；刘德兵担任董事长，负责战略与资本。

这不是一言堂，也不是纯粹的商业公司，更像是一种折中结构：用学术的方式做公司，用公司的方式活下来。

但这种结构，在理想与现实之间，很容易撞墙。

To B，就是现实的第一道裂缝。

智谱本来可以做C端，抢流量入口，追求短期增长。这也是大多数AI公司的选择。但唐杰却将重点放在了To B上。

跟政府、银行、学校打交道，客单价高、预算充足，看起来很好。

但代价也很清楚：回款周期从21天拉到112天，大客户频繁更替，多为一次性交易，甚至出现采购额高于销售额的怪事。

这不是一家典型科技公司该有的增长曲线，更像是一种工程型生意：不性感，但稳定；不爆发，但难死。

张鹏后来总结过一句很直白的话：C端不是为了赚钱，是为了给B端看能力。

2026年2月，裂缝第一次被放大。

GLM-5发布之后，问题出现了，不是技术失败，而是产品机制失控：规则透明度不足、灰度节奏过慢、老用户升级体验混乱。

一连串问题叠加之后，反应很直接：一天时间，700亿港元市值蒸发。

数字本身并不是最致命的，更致命的是连锁反应：投资者质疑，团队内部动摇，外面看热闹的人说，果然学者做不了商业。

但唐杰没有解释太多，他只是发了一封信，给出补偿方案，然后继续往前走。这很像他的风格：

不辩解，不拉扯，不对抗情绪，只继续做技术。

但更大的压力，其实来自叙事权。

智谱在国内大模型领域，曾经很多次领先行业，但时间并不会奖励先发。

2024年底，DeepSeek爆红，行业叙事开始变化，中国AI时刻被重新定义。先做的人，没有成为故事中心。

唐杰评价DeepSeek时，说了三个字：很震撼。

三个字里有多少东西，他没过多展开。但一个先做了十几年的人，被后来者抢了叙事，不可能不失落。

但这种失落，大概也就维持了几秒钟。

2026年1月8日，智谱赴港股上市。敲钟时，站在大铜锣旁的，是董事长刘德兵和CEO张鹏。

作为创始人和首席科学家的唐杰，则隐身团队里，安静得几乎不存在。

这并不意外。

王选院士说过一句话：“一个人老在电视上露面，说明这个科技工作者的科技生涯基本上快结束了。”

唐杰把这句话当成了戒尺。

他几乎不经营个人形象，微博昵称是唐杰THU，简介只有两行：清华大学教授、AMiner创始人。

他谈论的话题永远围绕技术，最常出现的一句话是：希望对大家有用。

敲钟仪式之后，唐杰写了一封内部信，标题是《用“咖啡”的精神做AGI》。信的第一句不是庆祝胜利，而是：

“年初的时候，一切都那么难。”

他讲了一个故事。在香港科技大学访问时，他和杨强教授在咖啡厅聊天。他说，这几天咖啡喝得太多，有点上瘾，需要戒一戒了。

杨强反问了一句：为什么要戒呢？

这句话，后来被他当作一种隐喻，做AGI不是冲刺，而是长期稳定输出。这也解释了他的另一个爱好，铁人三项：游泳、自行车、跑步。

他认为，这和科研一样：不是比谁冲得快，而是比谁能持续。

AMiner做了13年，千亿模型死磕了8个月，Coding路线迭代了五代，全是慢的东西。但慢的东西，磕久了，就是结构性的壁垒。

2026年6月12日，美国封禁Fable5，全球开发者震动，国内AI行业弥漫了一股焦虑。

马斯克在社交媒体上断言：中国大模型在跑分上追赶很快，但达到Fable级别，可能要到2027年第一季度。

唐杰回复了六个字：用不了那么久。

一个平时躲聚光灯的人，被踩到线了，还是会跳出来，不是为自己，是为中国大模型。

多年前，有学生在实验室里叹气，说做学术太难了。唐杰回了一句：“做学术，要像爷们一样顶天立地。”

顶天，是有先进理念，敢碰世界级难题。立地，是脚踩中国土地，把研究成果应用到现实世界中。

这话，他是对学生说的，也是对自己说的。他这辈子，就赌这一件事。

[1]清华大学计算机系官网

[2]《智谱唐杰：躲在喧嚣之外的“真大佬”》钛媒体

[3]《智谱上市，唐杰内部信要求全面回归基础模型研究》晚点LatePost

[4]《智谱正在穿越大模型最危险的那段路》36氪