在发布文心一言两周年之际,百度又发布新款模型。
近期,国内AI大模型厂商纷纷宣布“迭代”。3月10日,字节跳动豆包大模型团队官宣开源一项针对MoE架构的关键优化技术,可将大模型训练效率提升1.7倍,成本节省40%。3月6日,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B,通过强化学习,可在数学推理、代码生成等任务上实现精度提升。
百度发布两款新模型
3月16日,百度发布文心大模型4.5及文心大模型X1。据介绍,文心大模型4.5是百度首个原生多模态大模型。百度称,文心大模型4.5在多项测试中表现优于GPT4.5,API调用价格仅为GPT4.5的1%;文心大模型X1为深度思考模型,性能对标DeepSeek-R1,调用价格约为R1的一半。
具体来看,百度方面称,文心大模型4.5多项基准测试成绩优于GPT4.5、DeepSeek-V3等,并在平均分上以79.6分高于GPT4.5的79.14。而文心大模型4.5在多模态理解能力上提升,不仅有较强的图形推理、图表分析能力,还具备理解梗图、漫画、歌曲、电影等多模态内容的能力。
据百度介绍,文心大模型4.5已上线百度智能云千帆大模型平台,企业用户和开发者登录即可调用API;文心大模型X1也即将在千帆上线。百度搜索、文小言APP等产品,将陆续接入文心大模型4.5和文心大模型X1。
随着大模型技术的快速迭代,训练和推理成本的降低,大模型开源已成大势所趋。
今年2月,百度曾宣布文心一言将于4月1日免费,并宣布推出的文心大模型4.5,将于6月30日正式开源。彼时百度还表示,将在今年下半年发布文心大模型5.0。
AI厂商加速迭代
近期,AI大模型领域呈现技术迭代加速、多模态与深度思考能力突破、开源生态完善等趋势。国内外厂商在模型能力、应用场景等方面展开全方位竞争。
3月12日,谷歌DeepMind推出用于机器人技术的人工智能模型,这个机器人基座大模型名为 Gemini Robotics 和 Gemini Robotics-ER,旨在利用大语言模型的推理能力,帮助机器人适应复杂环境,从而完成现实世界中的复杂任务。
3月10日,字节跳动豆包大模型团队官宣开源一项针对MoE架构的关键优化技术,可将大模型训练效率提升1.7倍,成本节省40%。据介绍,MoE是当前大模型的主流架构,但其在分布式训练中存在大量跨设备通信开销,制约了大模型训练效率和成本。针对这一难题,字节在内部研发COMET计算-通信重叠技术,可大幅压缩MoE专家通信空转时间。
3月6日,阿里巴巴宣布推出最新的推理模型通义千问QwQ-32B。这是一款拥有320亿参数的模型,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现提升,整体性能比肩DeepSeek-R1,在消费级显卡比如家用电脑上也能实现本地部署。随后,国家超算互联网平台正式上线通义千问QwQ-32B API服务,向用户提供免费100万tokens的试用额度。
日前,全球知名创投机构Andreessen Horowitz发布了2025年全球100大生成式AI 应用排行榜,中国的AI技术实力在此次榜单中展现出强劲的竞争力。其中,DeepSeek在网页版应用中排名第二,仅次于OpenAI 的ChatGPT,其惊人的成长速度引起全球关注。
此外,在中国生成式AI中,字节跳动旗下的豆包也位列第十。中国其他知名的大型模型也成功进入榜单,包括月之暗面、海螺视频(第12名)和快手可灵(第20名),它们的排名均超越了Sora、Midjourney、Runway 等全球知名应用。
平安证券研报认为,全球大模型的竞争仍然激烈,这种激烈竞争将持续拔升全球大模型的能力上限。同时,全球领先大模型厂商对大模型研发的持续投入,也将为AI算力需求的持续增长提供有力支撑。
中国银河证券研报分析认为,AI Agent落地使得大模型集成度更高、算力资源需求更加旺盛,重心逐步从预训练转移到了特定应用场景的后训练,推理端算力规模有望提升。总体来说,推理算力有望推动应用的进一步增长,低成本算力时代带动应用端繁荣度提升,AI能力边际扩张依然需要依赖更强的模型和强大的算力支撑,有望开拓AI行业大模型共振发展新局面。
校对:李凌锋?????????????
“经过一天天的积累,两年多来,我家小朋友已经能背诵出一万五千多字的《论语》,熟练诵读二三万字的《孟子》。”来自青浦重固镇的李新莹说,青浦...
热血电竞巅峰决战,“二次元”文化浪潮来袭,文创IP“萌力”十足……近年来,面对“火出圈”的潮流文化和Z世代年轻消费群体新需求,盐城经济技术开发区持续打造新模式新场景。 热血电...
近日,华润医药商业集团有限公司及其下属华润空港(北京)国际贸易有限公司、华润医药商业集团医疗器械有限公司、华润润曜健康科技(北京)有限公司、华润润采医药(北京)有限公司、华润复...
随着汽车产业的发展转型,新能源汽车市场持续革新,对汽车玻璃也提出了更高的需求。永刚玻璃科技紧跟时代的发展步伐,布局新能源汽车领域,持续扩...
北方工业大学与社会科学文献出版社近日联合发布《北京城市治理蓝皮书:北京城市治理研究报告(2024)——京津冀协同发展背景下的城市群治理》。蓝皮书称,京津冀坚持“科技引领、布局未...
AI点苗机10秒钟数完3000余尾虾苗,机械臂40秒移栽30株种苗,无人驾驶翻耕机24小时作业……春耕时节,浙江大地上处处可见“数字园丁”,绘就“赛博”农业新图景。 “咔嗒、...
12月11日,美团企业版在上海举办“SIMPLE激活企业内生力”第二届企业消费管理大会,国务院发展研究中心市场经济研究所副所长王青,中国人民大学商学院副教授王强,中国贸促会全国...
日前,文化和旅游部公布了第四批国家级旅游休闲街区名单,敦煌夜市文化旅游休闲街区榜上有名。 敦煌夜市始建于1991年,位于敦煌市阳关中路,由沙州市场、秦州户商业街、风情城三部分...
近期,上汽大通MAXUS带来了一款纯电MPV——MIFA...
如今的油价,让燃油车的用车成本不断上升,可以说一定程度上...
2022年6月30日,几何E正式上市,定位纯电小型SUV...
今天编辑不想讨论技术落后不落后,对于老百姓来说,成熟稳定...