智东西作者 程茜编辑 云鹏
智东西6月30日消息,百度正式开源文心大模型4.5系列模型!
此次百度一口气开源了10款模型,涵盖47B、3B激活参数的混合专家(MoE)模型,0.3B参数的稠密型模型等,并实现预训练权重和推理代码的完全开源。
▲Hugging Face上的文心大模型4.5系列模型开源列表
目前,文心大模型4.5开源系列已可在飞桨星河社区、Hugging Face等平台下载部署使用,同时开源模型API服务也可在百度智能云千帆大模型平台使用。
自此,百度成为国内继腾讯、阿里、字节之后的又一家开源大厂,这也是百度面向大模型进入应用爆发黄金时期的最新举措。
早在今年2月,百度就已预告了文心大模型4.5系列的推出计划,并明确将于6月30日起正式开源。不过百度这次的开源列表没有其升级版文心大模型4.5 Turbo系列。
Hugging Face:https://huggingface.co/baidu/models
飞桨星河社区:https://aistudio.baidu.com/modelsoverview
GitHub:https://github.com/PaddlePaddle/ERNIE
技术报告:https://yiyan.baidu.com/blog/posts/ernie4.5
一、开发者热议,点名文心大模型4.5 Turbo开源
Reddit上的开发者认为,百度此次开源的模型中小参数的版本对内存受限的配置是不错的选择,他还认为300B可以和DeepSeek V3 671B战斗,21B可以与阿里Qwen 30B战斗。
也有开发者指出,百度此次开源的模型中,28B模型在基础文本能力上增加了视觉功能很酷。
开发者也在期待百度文心大模型4.5 Turbo的开源:
二、原生多模态基础大模型,多项评测超Qwen3、DeepSeek-V3
文心大模型4.5于3月16日发布,是百度自研新一代原生多模态基础大模型,在多个测试集上的测评表现已经超过GPT-4o。
其图片理解涵盖照片、电影截图、网络梗图、漫画、图标等多种形态,也能理解音视频中的场景、画面、人物等特征,并且在生成名人、物品等方面更具真实性。
▲文心4.5系列模型与Qwen3、DeepSeek-V3基准测试比较
百度官方公众号提到,文心4.5系列模型均使用飞桨深度学习框架进行高效训练、推理和部署。在大语言模型的预训练中,模型FLOPs利用率(MFU)达到47%。实验结果显示,该系列模型在多个文本和多模态基准测试中达到SOTA水平,在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果突出。模型权重按照Apache 2.0协议开源,支持开展学术研究和产业应用。此外,基于飞桨提供开源的产业级开发套件,广泛兼容多种芯片,降低后训练和部署门槛。
对于原生多模态大模型,3月初,百度创始人、CEO李彦宏在人民网发表的署名文章就提到:“原生多模态大模型,打破之前先训练单模态模型再拼接的方式,通过统一架构实现文本、图像、音频、视频等多模态数据的?原生级融合,实现对复杂世界的统一理解,这是迈向通用人工智能(AGI)的重要一步。”
三、文心大模型4.5背后,三大关键创新
文心大模型4.5系列背后的关键技术创新包括:
1、多模态异构MoE预训练:其模型基于文本和视觉模态进行联合训练,可捕捉多模态信息的细微差别,并提升文本理解与生成、图像理解以及跨模态推理等任务的性能。
为了实现这一目标,避免一种模态阻碍另一种模态的学习,百度研究人员设计了一种异构MoE结构,并引入了模态隔离路由,采用了路由器正交损失和多模态标记平衡损失。这些架构选择可以确保两种模态都得到有效表示,从而在训练过程中实现相互强化。
2、可扩展、高效的基础设施:百度提出异构混合并行和分层负载均衡策略,以实现ERNIE 4.5模型的高效训练。研究人员通过采用节点内专家并行、内存高效的流水线调度、FP8混合精度训练和细粒度重计算方法,实现了预训练吞吐量提升。
在推理方面,研究人员提出多专家并行协作方法和卷积码量化算法,以实现4位/2位无损量化。此外还引入具有动态角色切换的PD分解,提升ERNIE 4.5 MoE模型的推理性能。基于PaddlePaddle构建的ERNIE 4.5可在各种硬件平台上提供高性能推理。
3、针对特定模态的后训练:为了满足实际应用的多样化需求,百度针对特定模态对预训练模型的变体进行了微调。其大模型针对通用语言理解和生成进行了优化。
VLM专注于视觉语言理解,并支持思考和非思考模式,每个模型都结合使用了监督微调(SFT)、直接偏好优化(DPO)或统一偏好优化(UPO)的改进强化学习方法进行后训练。
在视觉-语言模型的微调阶段,视觉与语言的深度融合对模型在理解、推理和生成等复杂任务中的表现起着决定性的作用。为了提升模型在多模态任务上的泛化能力和适应性,研究人员围绕图像理解、任务定向微调和多模态思路推理三大核心能力,进行了系统性的数据构建和训练策略优化。此外,其利用可验证奖励强化学习(RLVR)进一步提升模型对齐和性能。
结语:全球大模型产业竞争加剧,百度拥抱开源
针对百度此次开源,南加州大学计算机科学副教授、三星年度人工智能研究员Sean Ren在接受外媒采访时提到:“每当一个大型实验室开源一个强大的模型时,它都会提高整个行业的标准。百度的举动给OpenAI和Anthropic等闭源模型的提供商带来了压力,迫使它们证明API和高价的合理性。”
作为国内最先入局大模型研发的巨头之一,百度已经形成了文心大模型4.0 Turbo、性能强劲的轻量模型ERNIE Speed Pro和ERNIE Lite Pro到当下的文心大模型4.5、文心大模型X1,以及升级版文心大模型4.5 Turbo等模型系列,其模型数量稳步递增,模型类型愈发多元。到2024年,文心大模型的日均调用量达到16.5亿,而2023年同期这一数字仅为5000万次,增长达到33倍。
Sean Ren认为虽然大多数消费者并不关心模型代码是否开源,但他们确实在意更低的成本、更好的性能以及对其语言或地区的支持。这些好处通常来自于开源模型,它为开发人员和研究人员提供了更大的自由度,可以更快地进行迭代、定制和部署。”
《CHINESEGAYBIGCOCKS南京大雕》,《P6F3X2M7T9QJ8L1B4WZR》男生脱裤子㊙️露jiji
“Fuqer100%china”
刘若琳被王强c到高潮
……
07月01日
“男生被❌到爽🔞流性玩具网站”张本智和的含金量一下就起来了
↓↓↓
07月01日,国家气候中心:中国11月平均气温创1961年以来历史同期新高,白丝爆❌jk漫画网站免费,女趴下脱裙子撅屁股打pp,雷电将军爆乳18禁🔞网站,初音未来裸体被❌羞羞动漫
07月01日,深化改革构建高质量供给体系,金晨被狂揉下部❌羞羞文章,人与禽动ZoZ0性伦A,伊吕波涩图,关晓彤游泳服装
07月01日,四川蓬安:花田舞龙迎“龙抬头”,免费➕无码➕无套漫画,性调教贱奶头哭叫主人,美女裸体㊙️网站直播,08年雁门照还能找到吗阿娇
07月01日|“端午经济”迸发消费新活力|jojo同人18❌漫画网站|欧成人精品H无码🔞|国产做受❌❌❌高潮游戏视频|老师让我看网上成人🔞
07月01日|中新健康丨中疾控称新冠疫情或在本月回升|v888Vm|Yaoi manga|扒开小舞❌狂揉❌难受3D|99精品国产亚洲AV无码
07月01日|旅新大熊猫“叻叻”启程回国|30分钟激励短片视频素材|斗1斗2神界浮乱派对登录入口|9lPORNY九色9l自拍|美女扒开内👙内裤看个够……
07月01日,巴基斯坦“迫切需要”中国治霾经验,夜兰裸体被❌羞羞的同人,顾青裴骑乘式,国产精品18🈲️高潮软件免费,砂狼白子被爆炒的视频
07月01日,卡塔尔促成向人质供药协议 以军在汗尤尼斯发动针对性袭击,亲嘴视频脱了衣服大全视频,国产精品大屁股白浆一区二区,,YOUJIZZJIZZJIZZ18,❌❌❌❌69日本120秒
07月01日|“智慧大脑”助力改造、"城中村"成"城中景" ……这些老城区不一样了|姐姐直播3.6.1|国产精品🔞❌❌❌❌视频瘾无码|欧美熟妇潮喷❌❌❌3Tm2FR|小幺女一级毛片AAA春巴櫻樱女
07月01日,释放银发经济潜力 托起幸福“夕阳红”,扒开老师❌狂揉❌电影,日本三级吃奶头添泬波多野加衣,女神危机爆衣满v破解版,周妍希浴室露大乳挤奶
07月01日,头部电商平台相继支持“仅退款” 会成为标配吗?,护士动漫美女被❌动漫,jlzzjlzz全部老妇女高潮,欧、美、日40、50、60、70熟妇,打白嫩美女㊙️光屁屁
07月01日,水利部公布第一批通过水利部标准化管理评价的大中型灌区、灌排泵站名单,模仿游戏王对战的本子,猜拳游戏女警察被扒衣的视频,大肉大榛一进一出免费看,扒开双腿调教羞辱奶头免费视频
07月01日|五四青春歌会唱响广州永庆坊手工书、皮影、凸版印刷 多国青年学子体验“书趣”|ChineseFuCK国语对白|日本性爱小视频|良家少妇射好多满了|萧炎把曹颖c到高潮
07月01日|【两会超话】外媒记者:亲历两会进程 亲身感受中国发展|男男gaYGAYS✅亚洲老师网站|班长没带罩子让捏了一节课的视频|女学生裸体挠全身tk丨vk|巨乳美女❌❌爆乳
07月01日|【澜湄印象】玉树印象|女人被拳交高潮狂喷|粉嫩小雪双乳被到喷水18漫画|金·卡戴珊做爰A片videos|白丝小舞夹腿挣扎求饶的漫画内容
LPL和LCK的最大差别,赵牧辰李定豪正面刚|南水北调中线引江补汉工程首台硬岩掘进机“江汉先锋号”掘进始发|散兵被万叶扒开腿做❌|蜜桃隐藏补单视频|欲奴|18禁女人自慰
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
闽公网安备 35010302000113号