最近几天,一条蓝色的鲸鱼搅混了海内外AI行业的水。占据媒体头条、应用榜单最前列、科技社区话题中心的不再是OpenAI,而是DeepSeek这家中国AI公司。
当地时间1月27日,受DeepSeek引发的风暴影响,以科技股为主的纳指下跌近3%。芯片巨头英伟达股价大跌16.86%,市值蒸发了5890亿美元,相当于超3个AMD的市值,创美股历史上最大单日个股蒸发规模。其他芯片股中,AMD跌6.37%,博通跌17.4%。科技巨头微软跌2.14%,谷歌跌4.03%。
DeepSeek指出了另一种可能
处于风暴中心的,正是在近一个月内发布了两款重磅模型的DeepSeek。
1月20日,DeepSeek发布了其推理模型DeepSeek-R1。官方释出的评测结果显示,在数学、代码、自然语言推理等任务上,其性能可对标OpenAI o1正式版。该公司虽未披露R1的训练成本,但其API服务定价比起o1正式版要低上27-55倍。
12月底,DeepSeek还发布并开源了新一代基座模型DeepSeek-V3,当时就已凭借极高的性价比引发国内外热议。在多项评测集上,该模型逼近GPT-4o、Claude-3.5-Sonnet等顶尖闭源模型,并和Meta Llama-3.1-405B、阿里Qwen2.5-72B等其他开源模型拉开差距。
更令人瞩目的是,DeepSeek在其官方技术论文中透露,V3模型是在配备了2048个英伟达H800 GPU的集群上进行训练的,H800是英伟达特供中国市场的AI芯片,在性能上不及先进的H200、H100等。据DeepSeek计算,V3的训练成本为557.6万美元。
而OpenAI最大竞争对手Anthropic的首席执行官Dario Amodei曾表示,像GPT-4o这类模型的训练成本约在1亿美元,到2027年这一成本可能会飙升至100至1000亿美元。
尽管模型训练成本并不直接等同于整体开发成本,但与美国科技巨头动辄在AI基建上投入的几百亿美元相比,这笔不到600万美元的数额让它们陷入了漫天质疑中。投资银行Saxo首席投资策略师Charu Chanana表示,DeepSeek通过使用不那么先进且更具成本效益的硬件来开发尖端的AI模型,挑战了美国科技公司在高成本AI基础设施上的大量投资。
以往不论AI泡沫论如何喧嚣,都很难动摇英伟达作为卖铲人的地位。因为其客户,也就是各大科技公司仍然相信AI的长期价值,在坚定加大对AI的投资,英伟达始终是获利的一方。
但这次不同的是,投资者们关注的核心焦点之一是,训练模型是否仍需要大量及高性能的芯片,而这可能会导致市场对卖铲人英伟达的优势进行重新评估,即能否通过一种成本效益更高的方式,来取得AI方面的突破。
硅谷巨头:对外解释,私下研究
面对市场冲击,巨头们开始尝试用另一套叙事逻辑来平息华尔街的质疑。英伟达在发给媒体的邮件中回应称,DeepSeek是一项卓越的AI进步,他们展示了如何使用测试时间scaling的技术来创建新模型。而在推理这一阶段中,仍然需要大量的英伟达GPU和高性能网络。
微软董事长兼CEO Satya Nadella则在社交平台上表示,杰文斯悖论再次上演!随着AI变得更加高效和普及,我们将看到它的使用量激增,最终成为一种我们永远无法满足的商品。杰文斯悖论是一条知名的经济学理论,指当技术的进步导致某种资源的使用更加高效时,消费者或企业对它的使用需求可能会大幅增加,虽然其使用成本降低了,但总消耗最终反而会上升。
OpenAI首席执行官Sam Altman也在社交媒体X上发帖称,DeepSeek的R1是一个令人印象深刻的模型,特别是能够以这个价格交付成果,对于新竞争者的到来表示振奋。他强调,但最让我们兴奋的是,我们能够继续执行我们的研究路线图。并且相信,现在比以往任何时候都更需要更多的计算能力,来实现我们的使命。
彭博社引述知情人士说法称,OpenAI内部普遍认为,需要认真对待中国公司的发展。其中一些员工正在试图弄清楚DeepSeek是如何能够发布这样的模型的。
而在硅谷,OpenAI不是唯一一家开始紧急重视起DeepSeek的公司。据硅谷科技媒体The Information此前报道,同样发力开源模型的Meta对DeepSeek的进展感到恐慌。员工们担心,下一代Llama模型的性能可能无法达到DeepSeek的水平。为此,他们已成立了多个专门的研究小组,来剖析DeepSeek并利用这些见解改善其模型。
这些科技巨头们向来信奉的是大力出奇迹的原理,豪掷重金打造提供算力、存储能力、高性能网络支持的数据中心,在此基础上追求AI模型的突破。就在上周,Meta创始人兼CEO马克middot;扎克伯格还表示,公司计划2025年资本支出将达600亿至650亿美元,继续用于建设AI基础设施。此前,Meta预计2024年资本支出在380亿至400亿美元。
不久前,OpenAI还联手软银、甲骨文成立了一家合资企业Stargate。该企业计划在未来四年内投资5000亿美元,用于在美国建设新的AI基础设施,并将立即开始部署1000亿美元。这一项目引发了埃隆middot;马斯克的抨击,他公开表示,这些企业实际上没有钱,他有充分的证据证明软银获得的资金远低于100亿美元。
马斯克旗下的初创企业xAI之前更是斥巨资追赶对手的代表。xAI正在美国建立一台超级计算机,号称是世界上最强大的AI训练系统。目前该计算机连接了10万块英伟达GPU,xAI计划将其扩大至最少一百万块,马斯克还放话称瞄准了至少10亿块GPU。
本周,美股七巨头中Meta、微软等将陆续发布最新财报。在过去几个季度,由于对AI的持续投入未能取得可观的回报,这些公司已经频频受到华尔街投资者的质疑。围绕DeepSeek的争论或将成为市场关注的重点,等待高管们的解答和平息。
在“巳巳如意,生生不息”的高频显现中,我们离首个“人类非遗版”春节已越来越近。 “春节就像一把神奇的钥匙——只要踏入春节的门槛,就能读...
“参加进博会对美利肯地材业务产生了显著作用。自2007年投产以来,我们位于张家港的工厂在服务整个亚太地区特别是中国市场方面发挥了重要作用。”美利肯地材亚太区高级设计与市场总监L...
在上海虹桥国际中央商务区管理委员会、上海闵行区人民政府的指导下,毕马威中国携手闵行区南虹桥12日成功举办了2024年毕马威中国工业制造行业峰会暨第一届智能制造科技50榜单发布会...
2024年的国内汽车市场,整体态势相当不错,批发销量、生产量等,均创造了年度历史新高。尤其是年底阶段,国内车市“翘尾”现象明显。乘联会公布的2024年12月销量数据显示,12月...
记者26日从北京市交通委获悉,当天,北京市发布2025年小客车指标配额和配置比例,2025年北京市小客车指标配额为10万个,其中普通小客车指标2万个,新能源小客车指标8万个。此...
近日,华润医药商业集团有限公司及其下属华润空港(北京)国际贸易有限公司、华润医药商业集团医疗器械有限公司、华润润曜健康科技(北京)有限公司、华润润采医药(北京)有限公司、华润复...
在“九门四阁”间感受筑城文化魅力 ——2025年贵阳城市文化打卡活动首日见闻 新年伊始,贵阳掀起了一阵城市文化打卡热,《王阳明的故事》巡展在达德学校旧址举行,一场红色文化作...
2024年11月16日,2024“上海-东京”中日城市管理精细化研讨会在上海隆重举行。本次研讨会由上海市住房和城乡建设管理委员会、徐汇区人民政府主办,并得到了日本国驻上海总领事...
近期,上汽大通MAXUS带来了一款纯电MPV——MIFA...
如今的油价,让燃油车的用车成本不断上升,可以说一定程度上...
2022年6月30日,几何E正式上市,定位纯电小型SUV...
今天编辑不想讨论技术落后不落后,对于老百姓来说,成熟稳定...