6月22日,智谱AI继续股价大涨,盘中市值一度飙升到1.2万亿港元。
一家年营收仅7亿的公司,凭什么让投资者陷入疯狂?
答案藏在一场AI范式革命里。
2026年6月12日,美国政府一纸禁令,Fable 5没了。上线才三天,全球下架,官方给出的理由是:
国家安全。
跟之前的大模型不一样,Fable 5不只会聊天。
它更像一名数字员工,能操作你的电脑,自己规划任务,写代码、跑测试,修bug。更恐怖的是,它能把一个专业团队干两月的活,一天就干完了。
这并非天方夜谭。
来自美国宾夕法尼亚大学的测试,Fable 5仅用20分钟,就复刻了著名游戏《我的世界》。
大模型的战场,正从能聊天变成能干活。谁能让AI真正干活,谁就拿到下一张入场券。而美国人,似乎又领先一步。
网上弥漫着一种焦虑,很多人在问:中国大模型,是不是又被甩开了?
关键时刻,清华教授出手了!
Fable 5刚下线没几天,6月17日,一家叫智谱的中国大模型公司,就宣布GLM-5.2全量开放。
GLM-5.2有多厉害,它能扛住Fable 5吗?先看一组数据:
在全球权威的AI编程能力评测榜单Code Arena上,GLM-5.2以1595分排名全球第二,第一是已经下架的Fable 5。
换句话说,在还能用的大模型里,它排名第一。
网友们直呼疯狂,Arena官方则表示,这是一个令人难以置信的里程碑。
这意味着,国产开源大模型在Coding这件事上,首次跻身全球御三家:Claude、OpenAI和智谱。
在此之前,这个位置一直是谷歌Gemni的。
GLM-5.2并非一夜逆袭,它的背后,是一位闷头坐了13年冷板凳的清华教授。
他,叫唐杰。
2024年底,DeepSeek R1横空出世,全球都在喊:中国AI的DeepSeek时刻。大模型行业一夜变天。
就在很多人还在拼参数、拼价格、拼下载量时,清华大学计算机系教授、智谱首席科学家唐杰,却做出一个惊人判断:
Chat这一仗已基本打完了!
在他看来,Chat这个范式快到头了,边际收益正急剧下降,剩下的更多是工程和技术上的问题,而非颠覆性的范式创新。
下一个范式也许是让每个人都能用AI做一件事,聊天不是终点,干活才是!
那什么才算是干活呢?最自然,也是水到渠成的一个方向,是写代码(Coding)。
理解代码库、跨文件追bug、跑通测试,一个模型如果能自己写代码,它就能自己规划、自己执行、自己纠错。
某种意义上讲,它就是一个能干活的智能体。
唐杰很笃定,但团队内部还是为此争论了无数个夜晚。最终,由唐杰拍板,将所有精力投入到Coding领域。
这不是他第一次押注。更早的时候,GPT-3横空出世,智谱要做一个决策:做不做千亿参数大模型?
唐杰很清楚,如果要做,一旦失败了,就可能把公司送进坟墓。
但明知道有风险,他还是决定死磕。
在公司内部决策会上,他的表态一锤定音:如果成功了,那至少证明中国的大模型公司,技术能力也能达到世界级水平。
他不是没犹豫过,只是犹豫完了,还是选择继续死磕。
2021年,智谱从济南超算租了1000张A100卡,从底层重构算子,训练了8个月。
彼时,作为智谱AI的孵化方之一,整个智源研究院也只有480张A100,智谱的投入可谓大手笔。
到2022年7月,智谱训练出GLM-130B,总投入600万元。
当OpenAI烧掉近3000万,终于踹开人类第一扇千亿大模型大门时,唐杰团队靠着极致的工程优化,以远低于对手的成本,砸出中国首个开源千亿大模型。
这种判断力不是天生的。
2006年,唐杰清华博士毕业,大公司开出几倍薪酬,国外大学给了offer,但他还是选择留校搞科研。
促使他做出这一决定的人,是王选院士。
他想效仿王选以教授身份推动技术创新与产业化。
就在唐杰毕业前夕,2006年2月,王选老先生驾鹤西去,唐杰的选择在冥冥中化身为一种传承。
彼时,全球论文数量已经达数亿篇,但论文背后的规律却没有人去总结。
唐杰试图开发一款叫AMiner的工具,用AI挖掘全球学者的论文和合作关系,建一张学术界的地图。
那年头,没人关心学术工具,热钱涌向电商和游戏,他一做就是13年。
13年里,互联网首富换了好几茬。唐杰在清华的办公室里,带着学生一篇一篇论文抠。
这段苦行僧般的经历,虽然没有给唐杰带来财富,却磨出了他对大规模数据、对AI的判断力。
这种判断力,花钱买不到,赶工赶不出来,只能用时间熬。
2019年,唐杰带着清华KEG实验室团队,创立智谱时,AMiner十几年积累的底色,直接成了它的技术地基。
也正是凭借这种判断力,他敢在公司初创、生死未卜时,顶住压力,砸下真金白银,训练出中国最早的千亿大模型。
后来,当全行业陷入拼参数、拼价格的内卷泥潭时,他再次抽身,把下一代研发资源集中压在Coding这个更难,但也更接近AGI的方向上。
很多AI公司从第一天起,目标就很清晰:做产品,做应用,做用户。
但唐杰不是。
他做智谱,从一开始就没把大模型当聊天工具。在他眼里,大模型的终局不是对话,而是AGI,是能替代人干活的智能体。
▲图源:腾讯科技
这条路一开始就不轻松,因为它意味着:不做爆款应用,不抢流量入口,不追短期增长。只做一件事:
把智能往前推。
智谱的核心团队结构,也从一开始就写进了这种选择。
唐杰担任首席科学家,负责技术方向;张鹏担任CEO,负责商业落地;刘德兵担任董事长,负责战略与资本。
这不是一言堂,也不是纯粹的商业公司,更像是一种折中结构:用学术的方式做公司,用公司的方式活下来。
但这种结构,在理想与现实之间,很容易撞墙。
To B,就是现实的第一道裂缝。
智谱本来可以做C端,抢流量入口,追求短期增长。这也是大多数AI公司的选择。但唐杰却将重点放在了To B上。
跟政府、银行、学校打交道,客单价高、预算充足,看起来很好。
但代价也很清楚:回款周期从21天拉到112天,大客户频繁更替,多为一次性交易,甚至出现采购额高于销售额的怪事。
这不是一家典型科技公司该有的增长曲线,更像是一种工程型生意:不性感,但稳定;不爆发,但难死。
张鹏后来总结过一句很直白的话:C端不是为了赚钱,是为了给B端看能力。
2026年2月,裂缝第一次被放大。
GLM-5发布之后,问题出现了,不是技术失败,而是产品机制失控:规则透明度不足、灰度节奏过慢、老用户升级体验混乱。
一连串问题叠加之后,反应很直接:一天时间,700亿港元市值蒸发。
数字本身并不是最致命的,更致命的是连锁反应:投资者质疑,团队内部动摇,外面看热闹的人说,果然学者做不了商业。
但唐杰没有解释太多,他只是发了一封信,给出补偿方案,然后继续往前走。这很像他的风格:
不辩解,不拉扯,不对抗情绪,只继续做技术。
但更大的压力,其实来自叙事权。
智谱在国内大模型领域,曾经很多次领先行业,但时间并不会奖励先发。
2024年底,DeepSeek爆红,行业叙事开始变化,中国AI时刻被重新定义。先做的人,没有成为故事中心。
唐杰评价DeepSeek时,说了三个字:很震撼。
三个字里有多少东西,他没过多展开。但一个先做了十几年的人,被后来者抢了叙事,不可能不失落。
但这种失落,大概也就维持了几秒钟。
2026年1月8日,智谱赴港股上市。敲钟时,站在大铜锣旁的,是董事长刘德兵和CEO张鹏。
作为创始人和首席科学家的唐杰,则隐身团队里,安静得几乎不存在。
这并不意外。
王选院士说过一句话:“一个人老在电视上露面,说明这个科技工作者的科技生涯基本上快结束了。”
唐杰把这句话当成了戒尺。
他几乎不经营个人形象,微博昵称是唐杰THU,简介只有两行:清华大学教授、AMiner创始人。
他谈论的话题永远围绕技术,最常出现的一句话是:希望对大家有用。
敲钟仪式之后,唐杰写了一封内部信,标题是《用“咖啡”的精神做AGI》。信的第一句不是庆祝胜利,而是:
“年初的时候,一切都那么难。”
他讲了一个故事。在香港科技大学访问时,他和杨强教授在咖啡厅聊天。他说,这几天咖啡喝得太多,有点上瘾,需要戒一戒了。
杨强反问了一句:为什么要戒呢?
这句话,后来被他当作一种隐喻,做AGI不是冲刺,而是长期稳定输出。这也解释了他的另一个爱好,铁人三项:游泳、自行车、跑步。
他认为,这和科研一样:不是比谁冲得快,而是比谁能持续。
AMiner做了13年,千亿模型死磕了8个月,Coding路线迭代了五代,全是慢的东西。但慢的东西,磕久了,就是结构性的壁垒。
2026年6月12日,美国封禁Fable5,全球开发者震动,国内AI行业弥漫了一股焦虑。
马斯克在社交媒体上断言:中国大模型在跑分上追赶很快,但达到Fable级别,可能要到2027年第一季度。
唐杰回复了六个字:用不了那么久。
一个平时躲聚光灯的人,被踩到线了,还是会跳出来,不是为自己,是为中国大模型。
多年前,有学生在实验室里叹气,说做学术太难了。唐杰回了一句:“做学术,要像爷们一样顶天立地。”
顶天,是有先进理念,敢碰世界级难题。立地,是脚踩中国土地,把研究成果应用到现实世界中。
这话,他是对学生说的,也是对自己说的。他这辈子,就赌这一件事。
[1]清华大学计算机系官网
[2]《智谱唐杰:躲在喧嚣之外的“真大佬”》钛媒体
[3]《智谱上市,唐杰内部信要求全面回归基础模型研究》晚点LatePost
[4]《智谱正在穿越大模型最危险的那段路》36氪