文 |  天书 北方朔风

  千呼万唤,DeepSeek V4预览版终于发布。今年以来围绕V4的舆论真是太有意思了,先是年初美国科技媒体如The information不断“爆料”马上要出了,然后前段时间是一些大厂接连“催更”接着是一顿DS核心成员被挖走,梁文峰寻求融资的炒作。直到V4发布前两天,还有几家模型厂商借热度搞抢先发布。

  V4发布后,除了少部分人继续阴阳怪气,多数使用者和从业者还是给出了非常高的评价,只是抱怨pro版价格涨不少,但也都表示理解,毕竟DS官方说明了等下半年华为算力卡规模上来之后价格会大幅下降。结果刚过两天,DS就宣布Pro官网限时2.5折优惠和缓存价格永久降低90%(关于大模型使用中缓存命中这个概念大家可以自行了解下,这里就不解释了)。

  一直很迷惑,X嗅这家科技媒体经常还有很多有价值的行业文章的,但其公众号下面的前排评论经常都不是说认知和立场问题,就总有一种跟科技界不搭边的low穿地板的气息……

  这是什么概念呢?就是一大帮token高消费者抢着管梁文峰叫赛博义父的程度;同时大家也发现,便宜的flash版对多数场景也足够满足需求。

  了解DS团队风格的人都知道,虽然DS不是一个以商业化为导向的模型,但也不会干赔本赚吆喝的事,毕竟他们之前完全是用自己做量化交易的盈利来投资研发。那么发布两天后就大幅降价只能说明一个事实:他们发现成本扛得住。

  回到2025年DS R1问世之初,它就是第一个将推理模型原理公之于众,让全球AI实现整体大升级的模型,它就是那段时间内真正跟chatgpt站到了同一高度的模型。在这之后,美国几家AI巨头加速推高算力规模,同时美国政府继续打压中国公司获得先进显卡。于是以claude为代表,又将中国大模型甩开了一段距离。

  虽然这中间不断有人继续神秘化硅谷AI御三家的能力,渲染中美模型差距的不可跨越,但理性的观察者不难意识到,这种几个月的差距本质上就是算力,是显卡数量上的差距。

  看这次V4的发布,仍然还是AI界最清新脱俗的存在。不刷榜,不玩文字游戏,详尽公布各种技术原理细节的同时,坦然承认和美国目前最顶尖的模型间还存在几个月差距。只是这次,谁都清楚这几个月的差距要如何跨过去了。而且,从此甚至模型能力指标间的具体差异都不再是重点,等到国产大模型从训练到推理都能完全迁移到国产芯片生态上的那天,美国也就彻底失去对中国科技产业进行打压的能力了。

  美国国内有没有人对次有清醒的认识呢?当然有,黄仁勋对此一直看得很清楚。在上个月黄仁勋接受印度裔科技博主德瓦克什帕特尔的播客采访时就说,GPU又不是浓缩铀,根本没必要管得那么死。如果让中国建立起来一套独立的人工智能生态,长期来看受损的是美国的利益。

  然而德瓦克什帕特尔对此相当不认同,甚至和黄仁勋发生了争吵。同时多数美国人看到这期节目后,都认为黄仁勋这是不顾美国的利益。

  和国内的网络生态不同,在如今的美国科技圈子,尤其是AI圈子,播客几乎是最大的宣传平台,这些播客主持人有很大的影响力,基本他们的认知就决定了多数舆论的认知。在和黄仁勋的对话中,德瓦克什帕特尔表现得非常铁血美国人,这也代表了硅谷科技媒体对中国普遍的态度。

  相当讽刺的是,硅谷这帮人虽然反华的比例很高,但是放在美国如今的大环境,已经算是比较了解中国的一批人了。但说到底,他们对中国的了解依然是一知半解的,往往带有一种莫名其妙的偏见。德瓦克什帕特尔曾经批评中国,但是给出的理由绝对不是中国人能想到的,他说中国没有乔罗根,莱克斯弗里德曼,以及乔丹彼得森这样优秀的公共知识分子。

  乔丹彼得森我们都知道,就是和齐泽克辩论的那个龙虾教授,这两年他的主要业务也是做播客。虽然在和齐泽克辩论时我们就知道这位的水平实在不高,但姑且还算是公共知识分子;可是乔罗根和莱克斯弗里德曼怎么就成公共知识分子了?他们是美国最顶流的播客主持人,但是本人的水平相当不咋地。如果一个国家占据公共知识分子生态位的是这种人,那确实挺没救的。

  很不幸的是,虽然美国保守派和进步派确实都有不少学养深厚的知识分子,但是当下美国,尤其是科技圈子里,占据公共知识分子生态位的确实是这帮播客主持人。德瓦克什帕特尔大概也自诩为公共知识分子,他这期节目就是来对黄仁勋进行审判的。

  在中国的舆论场里,公共知识分子们是如何毁灭自己名声的,我们已经看到了。而北美的科技播客们在狂妄这件事情上比中国公知有过之而无不及。德瓦克什帕特尔属于那种相信人工智能是美国最大的希望,所以只要坚持限制中国获取先进芯片  ,一切就都会好起来的人。这些人对于美国人工智能狂热的贡献是非常巨大的,他们的身份就是AI神教的传教士。但这种人对于人工智能真的了解吗?

  当然,皮衣黄也不可能真是站在中国这一边的,他说到底是个美国资本家。不过作为AI行业目前最大赢家,他对于AI的理解显然不是这些网红能比的。

  黄仁勋明白几个道理。第一,如他在这档节目里说的,芯片的计算能力不是只靠制程提升来提升的,还要看总体的设计。中国虽然在先进半导体问题上暂时被限制,但是其他领域的提升依然可以实现。实际上这也不是黄仁勋第一次说,之前英伟达一次发布会上的PPT里对此就有说明。黄仁勋认为中国凭借着能源领域的优势,是可以接受芯片效率相对较低的。

  第二,软件生态是用出来的,如果你不提供生态,别人就会占领空缺。黄仁勋比谁都清楚,英伟达的生态护城河的成功,固然和英伟达几十年如一日的技术投入有关系,但是如果没有用户,那么这种生态是建立不起来的。中国的市场足够大,足够建立起来一套完全不一样的生态,同时人工智能技术明显降低了在不同生态间迁移的成本。不过在这些新生代科技播客主持人眼里,这都是不重要的。

  第三,也是最关键的一点,黄仁勋知道,先进半导体也罢,先进的大模型也罢,人工智能生态也罢,都不是什么神话一般的技术,只要足够的投入,总是能弄出来的。中国有这样的能力。

  可是在德瓦克什帕特尔这类人眼里,中国是不可能搞出来这些东西的,就算中国之前的模型能力赶上了美国,那也一定是中国人在投机取巧,DeepSeek一定是蒸馏之类的。说起来好笑,在这点上,国内的黄皮精神美国人和大洋彼岸的印度裔美国人达成了同样的共识。

  在半导体领域工作了几十年的黄仁勋自然明白先进半导体是工程学而不是神话。但是如今硅谷未必知道,在无尽的AI狂热中,这些人陷入了人工智能的美国例外论,认为中国不可能搞出来先进人工智能和先进半导体的,这种宗教式的狂热和工程学的理念完全相反。

  这种想法当然不只是出现在硅谷科技圈,那些推动美国对中国半导体禁令的政客和美国商务部门的官僚,同样深信这种美国例外论,他们相信只要靠禁令就能解决一切问题。或许一部分技术专家能意识到这种想法的荒谬,他们更倾向于灵活的政策。但是既然黄仁勋这样的科技巨头都决定不了这种政策,那这些专家就更不可能了。

  美国喜欢声称自己是市场经济国家,但是在这个问题上却一点也不市场经济。市场经济规律告诉我们,需求是发明之母,只要有需求,先进的技术总是能搞定的。中国已经在很多领域证明了这一点,并且在很多方面做的比美国更好,可惜美国人总是视而不见。

  当然,国内芯片和模型的完全协同具体什么时候能实现还很难推断。但是这次DeepSeek V4模型的发布,就证明这个时间会比我们想象中更早些到来。这次V4的技术文档显示,虽然大量的工作依然是靠英伟达的GPU,但是如果不算少数试验性的模型,V4使用国产化芯片的比例显然已经相当高了。在黄仁勋和德瓦克什帕特尔吵架过后不到一个月,中国就证明了黄仁勋的答案更接近现实。

  当然,DeepSeek V4不是完美的,DeepSeek自己也说了,这是个预览模型,很明显后训练上还没有做完,后续的能力还有很大的提升空间,DeepSeek大概率会在几个月之后出几个不同的升级版,当下的版本有很多细节需要打磨。同时为了节省算力,这个模型结构的复杂度是相当高的,仍然有大量优化的空间,发布之后马上降价更是足以证明这点。

  上文说到,从市场经济的角度来说,中国的需求足够驱动人工智能技术的国产化。但这只是大而化之的说法,具体什么时候能实现,存在很多变数。而DeepSeek就是在加速这个过程。

  国内目前做计算卡的公司不少,但是想要让这些计算卡派上用场,就得更多用国产计算卡来训练模型,同时进行模型的推理。这一点指望造卡的公司自己来是不现实的,还是得人工智能公司来推动。这不是水平问题,英伟达水平高,算力充足,但是自己做的模型水平也没有存在感,说到底硬件和软件是两个不同的工程领域。

  DeepSeek这个团队的确可以担得起一句理想主义的赞誉。毕竟生态不成熟的时候,就让国产计算卡大量进入训练和推理的过程之中,是一件非常吃力不讨好的工作。当下的国产计算卡,虽然已经投入使用了不少,但是最理想的情况也就是能用,距离好用还有很远的距离。但是DeepSeek就是去做了,这没有些理想主义精神就是做不到的。

  这次V4发布,DeepSeek引用了《荀子》里边的一段话表达了自己的态度:不诱于誉,不恐于诽,率道而行,端然正己。在这个大模型升级以月为单位的时代,因为R1到V4中间漫长的模型真空期,舆论场有过很多轮的质疑和唱衰,类似The information这样的美国科技媒体,还制造了不少次谣言,但是DeepSeek一直坚持着自己的道路,保持着一种开放的心态。

  DeepSeek的研究员在V4发布的推特下评论,说AGI是服务于每个人的,虽然笔者认为AGI这个概念充满不确定性,但是这样的精神,显然远远胜于硅谷的野心家们。

  当然了,在德瓦克什帕特尔这种人眼里看来,理想主义这种东西是只属于硅谷的,只有那些天天炒作各种概念,然后赚得盆满钵满,还发表各种人工智能末日论吓唬普通人的巨头们才配当理想家。但真正的理想主义显然不会是这副德性。

  其实说起来很微妙,黄仁勋能看得清这些问题,除了他真的懂人工智能工程,很大一部分原因可能也在于他是一个黄种人。毕竟硅谷这种AI狂热是带有不少白人至上主义的成分。

  而且他比其他人更清楚他的显卡是从哪生产出来的。之前为了对谷歌自研的TPU进行狙击,他甚至在台湾买地送给台积电,就为了阻碍对手获得更多产能。那么为什么不能在美国生产呢?显然他很清楚,这样的局面如果一直持续下去得不到改变,最后会意味着什么。

  对于中国来说呢?正如我们过往文章中一再强调的,中美AI竞争到最后,比拼的是谁能完成适应AI时代的新型生产关系的变革。AI绝对是一把双刃剑,是社会矛盾激化的加速器,是史无前例的新范式催化剂。中国人不会因为在AI或者别的领域取得突破就被胜利冲昏头脑,相反我们时刻记着历史唯物主义给予我们的最根本的警惕能力。

  只是,这把双刃剑是我们不得不握紧的,这个加速器是不得不启动的。因为惧于矛盾催化就拒绝技术变革完全不现实,而且没有新的技术范式,新的社会范式也无从谈起。

  所以让技术的归技术,DeepSeek绝对当得起如冯骥所说的国运级的赞美。中国模型加中国芯片的实现,就是要打破美西方百来年笼罩在后发国家头上的最后一道技术枷锁。至于后续之事,就如无数革命先辈一样,我们自有自我变革的勇气。