
马年新春将至,国产AI大模型之战发火爆——短短天时间,多厂商模型密集新,其中包括MiniMax上线新代文本模型MiniMax M2.5。
当各大模型厂商围绕“春节档”展开密集发布与营销攻势,这款定位为“原生Agent生产模型”的产品,正式加入这场被业界称为“AI诸之战”的竞争。
尽管有着编程、工具调用、办公等生产力场景全球SOTA成绩,这在资本市场备受瞩目的公司却想抛开参数规模与模型榜单的简单比拼,而是开另种叙事:大模型重新定义Agent2.0时代!
能自动处理复杂任务南通万能胶生产厂家
在编程能力面,M2.5在榜单SWE-Bench Verified得分80.2、Multi-SWE-Bench得分51.3,较上代显著提升;在Multi-SWE-Bench等多语言复杂环境中越Opus 4.6,达到了行业好的水平。重要的是,模型展现出“原生Spec能力”——在编码前主动拆解架构与规划,接近真实架构师的工作模式。
工具调用和搜索能力面,模型能够自动处理复杂任务,在BrowseComp、Wide Search等多项Agent任务中以低的轮次消耗取得了优的果,相较于上代模型表现提升20 ,达到了行业顶水平。
办公场景中,在Word、PPT、Excel金融建模等工作区间阶场景中取得了显著的能力提升,在测评框架GDPval-MM与主流模型的对比中取得了59.0的平均胜率。
奥力斯 保温护角专用胶批发 联系人:王经理 手机:13903175735(微信同号) 地址:河北省任丘市北辛庄乡南代河工业区南通万能胶生产厂家
新民晚报记者获悉,MiniMax内部已率先受益于M2.5的模型能力——在内部真实业务场景中,整体任务的30由M2.5自主完成,覆盖研发、产品、销售、HR、财务等职能,且渗透率仍在持续上升。其中,在编程场景表现尤为突出,M2.5生成的代码已占新提交代码的80。
致理重构Agent经济
能之外,M2.5的另核心亮点在于致的理速度与成本控制。M2.5-lightning版本支持100 TPS以上输出速度,pvc管道管件胶是主流模型的2倍左右;输入价格约0.3美元/百万Token,输出约2.4美元/百万Token。按每秒输出100 Token计,连续运行小时成本约1美元;若按50 Token计,成本约0.3美元。
这意味着1万美元理论上可支持4个Agent连续工作年。MiniMax面认为,当能与成本不再构成约束,Agent规模化部署的经济模型将发生根本变化。
创Agent RL支撑速进化
过去108天,MiniMax从M2、M2.1迭代至M2.5,在SWE-Bench Verified成绩从69.4提升至80.2,进步曲线在同业中尤为陡峭。团队将这跃迁归因于大规模Agent强化学习(RL Scaling)。
其自研Forge框架通过解耦训练引擎与Agent,实现对任意Agent脚手架和工具的泛化优化,并通过异步调度与树状并策略实现约40倍训练加速。同时,在法层面采用CISPO优化与过程励机制,缓解长上下文场景中的信用分配问题,并将“任务真实耗时”纳入励函数,在果与响应速度之间取得平衡。
据透露,M2.5已于2月12日在MiniMax Agent上线,并于今日(13日)全球开源支持本地化部署。不到天,来自全世界的用户已经在MiniMax Agent上构建了1万多个,且仍在快速增长;而MiniMax也针对办公、金融、编程等频场景,在MiniMax Agent 上构建了多组度优化、开箱即用的套组。
新民晚报记者还了解到,MiniMax将在3月2日公布2025年全年业绩。
相关词条:罐体保温施工 异型材设备 锚索 玻璃棉 保温护角专用胶1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述南通万能胶生产厂家,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。




