加载中 0 收藏

分享

新模型来了,百度最新发布!多家AI厂商迭代

来源:证券之星  2025-03-16 21:06  分析汽车专享

在发布文心一言两周年之际,百度又发布新款模型。

近期,国内AI大模型厂商纷纷宣布“迭代”。3月10日,字节跳动豆包大模型团队官宣开源一项针对MoE架构的关键优化技术,可将大模型训练效率提升1.7倍,成本节省40%。3月6日,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B,通过强化学习,可在数学推理、代码生成等任务上实现精度提升。

百度发布两款新模型

3月16日,百度发布文心大模型4.5及文心大模型X1。据介绍,文心大模型4.5是百度首个原生多模态大模型。百度称,文心大模型4.5在多项测试中表现优于GPT4.5,API调用价格仅为GPT4.5的1%;文心大模型X1为深度思考模型,性能对标DeepSeek-R1,调用价格约为R1的一半。

具体来看,百度方面称,文心大模型4.5多项基准测试成绩优于GPT4.5、DeepSeek-V3等,并在平均分上以79.6分高于GPT4.5的79.14。而文心大模型4.5在多模态理解能力上提升,不仅有较强的图形推理、图表分析能力,还具备理解梗图、漫画、歌曲、电影等多模态内容的能力。

据百度介绍,文心大模型4.5已上线百度智能云千帆大模型平台,企业用户和开发者登录即可调用API;文心大模型X1也即将在千帆上线。百度搜索、文小言APP等产品,将陆续接入文心大模型4.5和文心大模型X1。

随着大模型技术的快速迭代,训练和推理成本的降低,大模型开源已成大势所趋。

今年2月,百度曾宣布文心一言将于4月1日免费,并宣布推出的文心大模型4.5,将于6月30日正式开源。彼时百度还表示,将在今年下半年发布文心大模型5.0。

AI厂商加速迭代

近期,AI大模型领域呈现技术迭代加速、多模态与深度思考能力突破、开源生态完善等趋势。国内外厂商在模型能力、应用场景等方面展开全方位竞争。

3月12日,谷歌DeepMind推出用于机器人技术的人工智能模型,这个机器人基座大模型名为 Gemini Robotics 和 Gemini Robotics-ER,旨在利用大语言模型的推理能力,帮助机器人适应复杂环境,从而完成现实世界中的复杂任务。

3月10日,字节跳动豆包大模型团队官宣开源一项针对MoE架构的关键优化技术,可将大模型训练效率提升1.7倍,成本节省40%。据介绍,MoE是当前大模型的主流架构,但其在分布式训练中存在大量跨设备通信开销,制约了大模型训练效率和成本。针对这一难题,字节在内部研发COMET计算-通信重叠技术,可大幅压缩MoE专家通信空转时间。

3月6日,阿里巴巴宣布推出最新的推理模型通义千问QwQ-32B。这是一款拥有320亿参数的模型,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现提升,整体性能比肩DeepSeek-R1,在消费级显卡比如家用电脑上也能实现本地部署。随后,国家超算互联网平台正式上线通义千问QwQ-32B API服务,向用户提供免费100万tokens的试用额度。

日前,全球知名创投机构Andreessen Horowitz发布了2025年全球100大生成式AI 应用排行榜,中国的AI技术实力在此次榜单中展现出强劲的竞争力。其中,DeepSeek在网页版应用中排名第二,仅次于OpenAI 的ChatGPT,其惊人的成长速度引起全球关注。

此外,在中国生成式AI中,字节跳动旗下的豆包也位列第十。中国其他知名的大型模型也成功进入榜单,包括月之暗面、海螺视频(第12名)和快手可灵(第20名),它们的排名均超越了Sora、Midjourney、Runway 等全球知名应用。

平安证券研报认为,全球大模型的竞争仍然激烈,这种激烈竞争将持续拔升全球大模型的能力上限。同时,全球领先大模型厂商对大模型研发的持续投入,也将为AI算力需求的持续增长提供有力支撑。

中国银河证券研报分析认为,AI Agent落地使得大模型集成度更高、算力资源需求更加旺盛,重心逐步从预训练转移到了特定应用场景的后训练,推理端算力规模有望提升。总体来说,推理算力有望推动应用的进一步增长,低成本算力时代带动应用端繁荣度提升,AI能力边际扩张依然需要依赖更强的模型和强大的算力支撑,有望开拓AI行业大模型共振发展新局面。

校对:李凌锋?????????????

评论区
最新评论
车市E家 > 头条 > 新模型来了,百度最新发布!多家AI厂商迭代

推荐阅读

 RECOMMEND