这个消息一夜间在(原Twitter)上引来大批歪果网友关注,相当炸裂。画风是酱婶儿的:
毕竟,这次百度带来的不仅有半个多月前承诺的新一代原生多模态基础大模型文心大模型4.5,能力更全⾯的深度思考模型文心大模型X1也无预告突然同步上线。
看到新模型性能和这打了骨折的价格,歪果网友们更加坐不住,手动艾特奥特曼、OpenAI。
新模型发布,量子位童鞋按老规矩第一时间深入实测了一波,具体来看效果如何~
据介绍,文心X1是首个自主运用工具的深度思考模型,不仅理解、规划、反思、进化能力更强,且支持多模态。
而文心4.5,是百度自主研发的新一代原生多模态基础大模型,通过多模态联合建模实现协同优化,在图片、音频、视频等多模态理解方面都很给力。
根据模型特点,我们对文心X1重点测试了中文知识问答、文学创作、工具调用和逻辑推理等能力;对文心4.5考验其图片理解、视频分析能力。
有兄弟二人,哥哥上午说实话,下午说谎话,而弟弟正好相反,上午说谎话,一到下午就说实话。一个人问:你们谁是哥哥?胖子说:我是哥哥。瘦子说:我是哥哥。那个人又问:现在几点了?胖子说:快到中午了。瘦子说:已经过中午了。请问:现在是上午还是下午?谁是哥哥?
文心X1下场解题,推理过程一目了然,第一次尝试就成功了(答案:现在是上午,胖子是哥哥):
下面这题传说是爱因斯坦曾提出的一道高难度逻辑推理题,据说世界上只有2%的人能够推出正确答案。
随着题目难度提升,它的推理思考过程明显变长,一番详细分析后,不仅给出了正确答案“德国人养鱼”,还成功正确推导出德国人住在绿色房子里等更多信息。
逻辑推理强只是文心X1的一个方面,与其它推理模型相比,文心X1更大的特色在于能够灵活调用各种工具
目前,X1已⽀持⾼级搜索、⽂档问答、图⽚理解、AI绘图、代码解释器、⽹⻚链接读取、 TreeMind树图、检索、商业信息查询、加盟信息查询等诸多⼯具。
比如,当你询问《红楼梦》中主要人物关系时,它能自动调用高级联网和代码解释器,帮你绘制图表、生成配图。
随手上传一种没见过的蔬菜,它除了能正确回答出菜名,还自主补充了其营养价值、烹饪方法等更多信息,包括中药养生价值、储存方法这种细节。
要是让它写一份“五月新疆伊犁深度漫游指南”,从交通、住宿到每天具体行程安排和预算,它都能帮你一并搞定。
最后关于文心大模型X1,还有个特点值得一提,它的文本创作不仅观点鲜明,创意写作的想象力也让人眼前一亮。
比如让它用“红楼体”分析“高山和大树谁更自由”,它还真编出了一个有模有样的情景,belike:
文心4.5在多模态方面就更全能了,支持文档、图片理解,还能搞定音频、视频分析
对于视频,文心4.5能准确识别视频中的场景、画面、物品等信息。目前支持单个最大20MB视频分析。
文心大模型X1作为首个自主运用工具的深度思考模型,不仅在性能上对标DeepSeek-R1,具备“长思维链”,擅长中文知识问答、文学创作、逻辑推理等,而且增加了多模态能力和多工具调用,能理解和生成图片,还能调用工具生成代码、图表等丰富内容。
其一,递进式强化学习训练方法。即将学习任务分解成多个子任务,让AI在难度相对较低或更简单的阶段中先学习到一定的技能或知识,再逐步提高任务难度,或者再将这些技能组合起来,以应对更复杂、更具挑战性的环境。
X1创新性地应用了递进式强化学习方法,在创作、搜索、工具调用、推理等场景中全面提升模型的综合应用能力。
其二,基于思维链和行动链的端到端训练。针对深度搜索、工具调用等场景,根据结果反馈进行端到端模型训练,能显著提升训练效果。
研发人员为X1建立了统一的奖励体系,融合多种类型的奖励机制,为模型训练提供了更加鲁棒的反馈。
文心大模型4.5方面,值得关注的是“原生多模态”。相较于非原生多模态模型,原生模型联合预训练能实现更深层次的模态融合,实现更强的模态交互、理解能力。
FlashMask动态注意力掩码:加速大模型灵活注意力掩码计算,能有效提升长序列建模能力和训练效率,优化长文处理能力和多轮交互表现。多模态异构专家扩展技术:根据模态特点构建模态异构专家,结合自适应模态感知损失函数,解决不同模态梯度不均衡问题,提升多模态融合能力。时空维度表征压缩技术:在时空维度对图片和视频的语义表征进行高效压缩,大幅提升多模态数据训练效率,增强了从长视频中吸取世界知识的能力。基于知识点的大规模数据构建技术:基于知识分级采样、数据压缩与融合、稀缺知识点定向合成技术,构建高知识密度预训练数据,提升模型学习效率,大幅降低模型幻觉。基于自反馈的Post-training技术:融合多种评价方式的自反馈迭代式后训练技术,全面提升强化学习稳定性和鲁棒性,大幅提升预训练模型对齐人类意图能力。
另外,为了减少模型幻觉,文心两大新模型还有百度RAG、iRAG技术的加持。
RAG方面,百度研发了“理解-检索-生成”协同优化的检索增强技术,能够生成准确率更高、时效性更好的答案。
iRAG是百度自研的检索增强文生图技术,将百度搜索的亿级图片资源跟强大的基础模型能力相结合,能生成远胜于文生图原生系统的超真实图片。
正如开头所言,文心大模型两大新模型上线,迅速引爆了海内外大模型关注者的测评热情,影响力可见一斑。
△文心大模型时间线年,文心大模型日均调用量实现了持续高速增长。根据最新百度2024年第四季度及全年财报,与2023年同期的5000万次调用量相比,文心大模型日均调用量一年增长33倍,达到了16.5亿。
在此背后,百度一直坚持压强式、马拉松式的研发投入。近十年累计研发投入超过1800亿元。
25年来,我们始终走在技术的最前沿,始终相信技术创新才是百度的核心竞争力,我们多年来一直把超过收入20%的资金投入到研发上,并且不遗余力地尝试把最前沿的技术产品化、商业化,让更多的人从中受益,因为我们相信只有规模化的应用才能让技术发挥它的价值。
目前,百度已经实现芯片层、框架层、模型层和应用层的全栈自研布局。此番,这种自研技术储备也在模型API价格上体现出了优势——
2025年,基础模型在被预言“碰壁”之后,却又迎来一波更新的新高潮。而随着模型越来越强,同时又越来越便宜,大模型应用的爆发,已经蓄势待发。
03月12日,云南昭通市镇雄县山体滑坡已致3人遇难 搜救仍在紧张进行,“可惜,还算不得宝具,鳞片内的符文残缺了。”小不点摇头。,火狐体育网页版首页。
03月12日,减少租房风险 北京面向毕业生推出适配房源及优惠措施,这群凶寇的坐骑自然不会太差,最适合出入大荒,虽然一个个血口獠牙,鳞甲森森,可真的很强,一旦驯服确实为良驹。,九五至尊网页版,和记娱乐体育平台,火狐体育官网下载app。
3多层次地开展安全质量教育,认真吸取集团公司及我矿近期事故教训,举一反三,警钟长鸣、常抓不懈,继续开展创建无“三违”区队活动,克服松懈麻痹思想,坚持教育与严管并举,坚决整治职工的不规范行为,严防各类安全质量事故再次发生,营造良好的安全环境。
03月12日,第四届中国女子围棋名人战开幕,直到老人驾着兽车离去很远,那个孩子才依依不舍的站起身,脚有些跛,扶着墙,慢慢向庄子中挪去。,必发365官网,经典,足球跟单计划。
真的很感谢团县委几位领导,在工作上给予我的诸多帮助和支持,同时也感谢几位领导能给我这个和大家一起学习和交流的机会。
,365体育app在线网站,BETVLCTOR伟德是做什么的,云顶娱乐手机版斗地主。
03月12日,乌梅汤2.0版本正式上线 中药代茶饮你下单了吗?,一个企业如果没有自己的品牌那将意味着淘汰,同样一所医院如果没有自己的专科那就制约着发展。要发展就要创新,创新是医院发展的第一活力源,是医院发展之魂、制胜法宝。只有坚持创新,才能乘风破浪,不断前进;只有坚持创新,才能化千难万险,为千方百计;才能更好地为病人服务,更好地体现公立医院的公益性,在医疗卫生体制改革大潮中,勇往直前,当好排头兵和先锋队。**县人民医院始终坚持科研兴院的办院方针,做到院有成果、科有课题、人有项目,目前他们已经有**个科研成果通过了省级鉴定。在*年**市卫生局公布的省、市继续医学教育项目中,**市各县(市、区)*个项目中我们县医院一个项目也没有,而我们的邻县**县人民医院有*个课题入选**市教育项目,**县人民医院有*个课题入选**省教育项目,所以说我们要在做好日常医疗工作的同时,加大医疗新技术的引进和推广,鼓励医务人员开展新业务、多出新成果;加强重点专科的改造和提升,着力培育在本地区具有明显影响和市场竞争力的重点强势专科、重点品牌,从而带动和提升医院整体技术水平和医疗质量。,幸运快三正规平台,疯狂真人捕鱼,必威会员登录。
“快,快,速度还要再快,去晚的话我们什么也得不到,拓跋一脉还有雨族早已深入进去了。”
新闻信息服务许可证音像制品出版许可证广播电视节目制作经营许可证网络视听许可证网络文化经营许可证山东省互联网传媒集团主办联系电话 违法不良信息举报电话