这个消息一夜间在(原Twitter)上引来大批歪果网友关注,相当炸裂。画风是酱婶儿的:
毕竟,这次百度带来的不仅有半个多月前承诺的新一代原生多模态基础大模型文心大模型4.5,能力更全⾯的深度思考模型文心大模型X1也无预告突然同步上线。
看到新模型性能和这打了骨折的价格,歪果网友们更加坐不住,手动艾特奥特曼、OpenAI。
新模型发布,量子位童鞋按老规矩第一时间深入实测了一波,具体来看效果如何~
据介绍,文心X1是首个自主运用工具的深度思考模型,不仅理解、规划、反思、进化能力更强,且支持多模态。
而文心4.5,是百度自主研发的新一代原生多模态基础大模型,通过多模态联合建模实现协同优化,在图片、音频、视频等多模态理解方面都很给力。
根据模型特点,我们对文心X1重点测试了中文知识问答、文学创作、工具调用和逻辑推理等能力;对文心4.5考验其图片理解、视频分析能力。
有兄弟二人,哥哥上午说实话,下午说谎话,而弟弟正好相反,上午说谎话,一到下午就说实话。一个人问:你们谁是哥哥?胖子说:我是哥哥。瘦子说:我是哥哥。那个人又问:现在几点了?胖子说:快到中午了。瘦子说:已经过中午了。请问:现在是上午还是下午?谁是哥哥?
文心X1下场解题,推理过程一目了然,第一次尝试就成功了(答案:现在是上午,胖子是哥哥):
下面这题传说是爱因斯坦曾提出的一道高难度逻辑推理题,据说世界上只有2%的人能够推出正确答案。
随着题目难度提升,它的推理思考过程明显变长,一番详细分析后,不仅给出了正确答案“德国人养鱼”,还成功正确推导出德国人住在绿色房子里等更多信息。
逻辑推理强只是文心X1的一个方面,与其它推理模型相比,文心X1更大的特色在于能够灵活调用各种工具
目前,X1已⽀持⾼级搜索、⽂档问答、图⽚理解、AI绘图、代码解释器、⽹⻚链接读取、 TreeMind树图、检索、商业信息查询、加盟信息查询等诸多⼯具。
比如,当你询问《红楼梦》中主要人物关系时,它能自动调用高级联网和代码解释器,帮你绘制图表、生成配图。
随手上传一种没见过的蔬菜,它除了能正确回答出菜名,还自主补充了其营养价值、烹饪方法等更多信息,包括中药养生价值、储存方法这种细节。
要是让它写一份“五月新疆伊犁深度漫游指南”,从交通、住宿到每天具体行程安排和预算,它都能帮你一并搞定。
最后关于文心大模型X1,还有个特点值得一提,它的文本创作不仅观点鲜明,创意写作的想象力也让人眼前一亮。
比如让它用“红楼体”分析“高山和大树谁更自由”,它还真编出了一个有模有样的情景,belike:
文心4.5在多模态方面就更全能了,支持文档、图片理解,还能搞定音频、视频分析
对于视频,文心4.5能准确识别视频中的场景、画面、物品等信息。目前支持单个最大20MB视频分析。
文心大模型X1作为首个自主运用工具的深度思考模型,不仅在性能上对标DeepSeek-R1,具备“长思维链”,擅长中文知识问答、文学创作、逻辑推理等,而且增加了多模态能力和多工具调用,能理解和生成图片,还能调用工具生成代码、图表等丰富内容。
其一,递进式强化学习训练方法。即将学习任务分解成多个子任务,让AI在难度相对较低或更简单的阶段中先学习到一定的技能或知识,再逐步提高任务难度,或者再将这些技能组合起来,以应对更复杂、更具挑战性的环境。
X1创新性地应用了递进式强化学习方法,在创作、搜索、工具调用、推理等场景中全面提升模型的综合应用能力。
其二,基于思维链和行动链的端到端训练。针对深度搜索、工具调用等场景,根据结果反馈进行端到端模型训练,能显著提升训练效果。
研发人员为X1建立了统一的奖励体系,融合多种类型的奖励机制,为模型训练提供了更加鲁棒的反馈。
文心大模型4.5方面,值得关注的是“原生多模态”。相较于非原生多模态模型,原生模型联合预训练能实现更深层次的模态融合,实现更强的模态交互、理解能力。
FlashMask动态注意力掩码:加速大模型灵活注意力掩码计算,能有效提升长序列建模能力和训练效率,优化长文处理能力和多轮交互表现。多模态异构专家扩展技术:根据模态特点构建模态异构专家,结合自适应模态感知损失函数,解决不同模态梯度不均衡问题,提升多模态融合能力。时空维度表征压缩技术:在时空维度对图片和视频的语义表征进行高效压缩,大幅提升多模态数据训练效率,增强了从长视频中吸取世界知识的能力。基于知识点的大规模数据构建技术:基于知识分级采样、数据压缩与融合、稀缺知识点定向合成技术,构建高知识密度预训练数据,提升模型学习效率,大幅降低模型幻觉。基于自反馈的Post-training技术:融合多种评价方式的自反馈迭代式后训练技术,全面提升强化学习稳定性和鲁棒性,大幅提升预训练模型对齐人类意图能力。
另外,为了减少模型幻觉,文心两大新模型还有百度RAG、iRAG技术的加持。
RAG方面,百度研发了“理解-检索-生成”协同优化的检索增强技术,能够生成准确率更高、时效性更好的答案。
iRAG是百度自研的检索增强文生图技术,将百度搜索的亿级图片资源跟强大的基础模型能力相结合,能生成远胜于文生图原生系统的超真实图片。
正如开头所言,文心大模型两大新模型上线,迅速引爆了海内外大模型关注者的测评热情,影响力可见一斑。
△文心大模型时间线年,文心大模型日均调用量实现了持续高速增长。根据最新百度2024年第四季度及全年财报,与2023年同期的5000万次调用量相比,文心大模型日均调用量一年增长33倍,达到了16.5亿。
在此背后,百度一直坚持压强式、马拉松式的研发投入。近十年累计研发投入超过1800亿元。
25年来,我们始终走在技术的最前沿,始终相信技术创新才是百度的核心竞争力,我们多年来一直把超过收入20%的资金投入到研发上,并且不遗余力地尝试把最前沿的技术产品化、商业化,让更多的人从中受益,因为我们相信只有规模化的应用才能让技术发挥它的价值。
目前,百度已经实现芯片层、框架层、模型层和应用层的全栈自研布局。此番,这种自研技术储备也在模型API价格上体现出了优势——
2025年,基础模型在被预言“碰壁”之后,却又迎来一波更新的新高潮。而随着模型越来越强,同时又越来越便宜,大模型应用的爆发,已经蓄势待发。
03月13日,马丁·雅克:我不赞同西方在民族议题上对中国的指责,开元棋牌网址是多少,必赢亚洲平台登录,MG真人怎么开户,澳门老金沙APP
03月13日,辽宁省深化与拉美地区经贸往来助辽企“走出去”,大发88手机官网下载,明牌抢庄斗牛必胜公式,必赢平台官方下载,皇冠体育官网下载
03月13日,(乡村行·看振兴)福建永定:沃柑俏枝头 乡村产业旺,爱游戏网址登录,银河国际进不去,尊龙网站怎么样,凯时k66傅彩
03月13日四张图片里的京津冀十年反水高的平台推荐bet在线官网天博棋牌日博体育在线日“新时代·新影像”:善用“小切口” 讲好“大故事”诸葛神算皇冠手机登录版下载杏耀官网登录地址万博官网手机版网页登陆
03月13日湖南怀化国际陆港跨境电商产业园开园真钱金沙下注必威备用网dafa登入新宝6注册登录入口……
03月13日,仅用6分钟完成通关手续 上海虹桥边检站完成一场跨越太平洋的生命救援接力,电玩游戏大厅下载,大发体育线路检测,乐鱼网站是多少,天博官方网址在线日,刷牙后到底要不要漱口?,AG真人入口登录,欧博会员登录,国际音标 线日普京将访朝鲜?中国外交部回应美高梅游戏下载大全AG亚美体育在线真人国际网址黄冠
03月13日,青海实现植物新品种授权“零”突破,彩神彩票邀请码大全,J9九游会官网,葡京赌盘网信誉综合最好,体彩手机在线日,美媒:勿低估中国汽车工业崛起重要性,威尼斯登录注册,贝博网址进不去,新宝gg2022世界杯,博雅斗地主
03月13日,众行致远|全球治理凝聚“南方”力量 ,博万体育平台正规吗,彩61去哪了,18luck网赌,什么网站
03月13日山西闻喜:51.2万亩小麦开镰 颗粒归仓抢收忙合乐hl8注册凯发娱乐官网网站天霁龙8国际最新地址
03月13日台湾多地降雪 民众兴奋追雪留影银河国际app下载官方平台快三购彩网云顶开户威尼斯人体育手机登陆
03月13日【湾区青年说】澳门青年周少杰营造“寻味”湾区新天地皇马官方网站vwin体育网站籃球比分捕鱼娱乐平台
潘展乐告状 汪顺告白,韦世豪身穿国足10号福建漳州芗城:乡村振兴跑 领略诗画浦南掌玩炸金花篮球投注平台有哪些dafabet手机版网页版365bet体育
网传女老师出轨学生被老公自曝,冯椿南京民众踏青赏景沐浴三月春光ku体育备用网址白鲸app官网下载大赢家比分网手机网葡京大转盘官网入口
浪姐5初舞台排名,后宫·甄嬛传内蒙古成立设施农业绿色发展技术研究院天博官方app下载安装千赢国际开户网址678体育bet365体育
本周末将上演多场焦点战,于正新剧《墨雨云间》爆了吗“山水工程”促进生态治理体系一体化发展澳门皇冠金沙官网娱乐华夏棋牌游戏亚洲bet356体育唯一十博体育是哪个国家
你的肌肤有多自律,王楚钦孙颖莎进8强东西问丨郭福祥:17、18世纪中法是怎样对望交流的?巴黎人信誉注册上下分的棋牌游戏平台打牌平台纬来体育在线买球
不时用俄语小声说真心话的邻桌艾莉同学,从地狱来的法官用速度最快的球迎战每场比赛,国羽在巴黎写下最热血的诗篇|夏奥热知识澳门网络游戏网址六合家中宝A火狐体育APP下载M6快速登陆
@BETHASH6