U8国际官网 分类>>

田丰:MiniMax M25击穿成本线个Agent劳动力全年无休U8国际- U8国际官方网站- APP下载

2026-02-18 11:42:39
浏览次数:
返回列表

  U8国际,u8国际官方网站,u8国际网站,u8国际网址,u8国际链接,U8国际APP下载

田丰:MiniMax M25击穿成本线个Agent劳动力全年无休U8国际- U8国际官方网站- U8国际APP下载

  2026年春节前夕,MiniMax正式上线新一代文本模型MiniMax M2.5。当各家大模型厂商围绕“春节档”展开密集发布与营销攻势,这款定位为“原生Agent生产级模型”的产品,正式加入这场被业界称为“AI诸神之战”的竞争。快思慢想研究院院长、特邀评论员田丰接受《每日经济新闻》记者采访时分享诸多精彩观点。

  《每日经济新闻》提问1:田老师,为何近期AI企业都在上线Agent有关的大模型,目前这类大模型拉开差距了吗?

  田丰:我国思维科学奠基人钱学森,曾经提出了思维系统观:“以逻辑单元思维过程为微观基础,逐步构筑单一思维类型的一阶思维系统,进而解决二阶思维开放大系统和高阶思维开放巨系统(如决策咨询系统)。”AI1.0时期的小模型正如单一思维类型的一阶思维系统,而能回答各种问题的AI2.0大模型则属于二阶思维开放大系统,目前的自主式智能体Agent正在向高阶思维开放巨系统发展,能够完成决策、执行等智慧思考行为。

  近期AI企业密集上线Agent相关大模型,本质上源于Agent浪潮到来的核心驱动力:

  1)Agent成为常规数字劳动力:SOTA级Agent即具有系统思考复杂问题的大局观,又有分析细分子问题的能力,已经超过人类平均水平,成为自动化执行、自主化决策的新质生产力。比如MiniMax M2.5在编码前主动拆解架构与功能规划,过程中自我检查,更接近真实架构师的“从总体到局部”思维模式。在理解和规划任务方面,基础模型提供了语言理解、任务拆分与推理的核心能力,而Agent则将这些能力转化为实际生产力。在面对持续变化的任务环境时,Agent能够通过与环境交互感知信息做出对应的变更思考和适配行动,而非仅能处理预设流程中的固定任务。这种“自主决策、工具调用、目标导向”的能力组合,使其成为通往AGI(通用人工智能)的主要探索路线)百万Tokens成本走向平价,人人可用:

  M2.5凭借极致推理速度和成本控制,在Agent经济可行性方面建立了显著壁垒。1万美元可支持4个Agent连续工作一年的成本结构,使得大规模Agent部署从“不可行”变为“可行”,这一成本优势正在重塑整个行业的经济模型。MiniMax创始人闫俊杰预测:“未来一两年,最好模型的推理成本还能再降低一个数量级。”

  toC市场上的通用个人智能体如“千问”、OpenClaw、Coze等,而toB专业服务智能体包括HR招聘助手、法务合同助手、财务审计助手、行业研究助手、金融风控助手、AI代码助手等等,垂直领域服务商深耕行业与职能岗位know-how。后续,将会形成通用智能体自主调用专业智能体的“智能体局域网”(企业内部)、“智能体互联网”(社会协作)。

  目前Agent赛道玩家身份鱼龙混杂,客单价从数千元到上千万元不等,价格体系十分混乱。真正的竞争焦点已从“流量争夺”转向“场景入口的定义权与AI能力”。MiniMax通过Agent 2.0产品明确瞄准“工作入口”而非“用户时长”,这种场景化定位正在形成差异化竞争优势。MiniMax M2.5的诞生,表明它不追求参数规模的极致,而是聚焦于在特定场景(编程、办公、生产力)中实现工程化的极致优化。

  “基础模型淘汰赛”竞争十分激烈,大部分玩家已经退出,只留下DeepSeek、MiniMax、BAT、字节几家,AI产品是模型能力外溢后的自然结果。MiniMax把几乎所有资源都集中押在了基座模型能力的持续提升上。M2.5的推出是这一战略的延续——先有强大的底座模型能力,再向外辐射到具体应用场景。MiniMax创始人闫俊杰说过“在大模型时代,真正的产品其实是模型本身,传统意义上的产品更像是一个渠道”、“AI会变得越来越强,而且这种增强几乎没有尽头”,这就是基础模型巨大的未来增长空间,而部分AI科研机构认为2027年AI会出现颠覆性的重大发展。

  从M2.5的定位来看,它是“原生Agent生产级模型”,其核心价值在于为Agent场景提供最坚实可靠的任务文本理解和复杂问题长程推理能力。在编程、工具调用、复杂任务拆解等Agent核心能力上,M2.5已经达到全球SOTA水平(SW E-Bench Verified 80.2%、Multi-SWE-Bench 51.3%)。这些能力是构建高效Agent的基石。

  快思慢想研究院认为,从市场发展看,Agent经济模型正处于“大爆发前夜”。2025年DeepSeek-R1在春节期间的成功已经证明,春节档是AI模型最佳的发布和推广窗口期。MiniMax选择此时发布M2.5,正是看准了Agent从概念走向规模化商用的关键时间节点。如果说APP是人类大脑的自行车,那么智能体就是我们大脑的“火箭”,下一代“知识工程”不是由数十个聪明人类大脑组成精英团队,而是由成千上万个智商140以上的专家智能体与极少数人类天才混编组成的“智慧王国”,效率超越纯人类团队一万倍。

  田丰:快思慢想研究院认为——成本降低对Agent商业化落地具有革命性意义。

  之前,Agent商业化面临的最大障碍是经济不可行性,智能体市场也将迎来平价普惠的“DeepSeek时刻”。以Cursor为例,这个被估值100多亿美元的编程Agent产品,曾因成本问题调整定价策略,引发社区巨大争议,持续降低的AI服务成本意味着指数级增长的市场空间。M2.5将推理成本降至主流模型的1/10至1/20,使得1万美元预算就能支撑4个Agent连续工作一年,这意味着企业部署大规模Agent集群的门槛被大幅降低。

  当Agent的运行成本降至每小时1美元(100 TPS输出)或0.3美元(50 TPS输出)时,其经济性已接近甚至低于人类初级劳动力的成本,这彻底打破了全球传统劳动力市场格局与游戏规则。很多企业已经开始考虑用Agent替代部分重复性工作劳动,而不是仅仅将其作为辅助工具,微型部门、一人公司涌现。MiniMax内部已率先实践了这一转变——整体任务的30%由M2.5自主完成,覆盖研发、产品、销售、HR、财务等职能,其中编程场景中M2.5生成的代码已占新提交代码的80%。

  智能体完成任务的复杂度可以用人类完成同样任务的时间周期来衡量,广大企业家群体热衷于经济性长周期的Agent能力面市,已形成Agent商业规模优势。因为Agent任务通常需要模型进行多轮自我调用,比如每个任务可能调用50次以上,推理速度的微小提升都会被放大。M2.5在SWE-Bench Verified测试中完成任务的速度比上一代M2.1提升了37%,这一速度提升在长周期Agent任务中显得至关重要。

  综上所述,MiniMax累计投入约5亿美元,仅用不到OpenAI 1%的资金就实现了全模态能力的全球第一梯队,这本身就证明了其成本效率的优越性。因此,M2.5的低定价是技术能力溢价的自然结果,而非补贴市场的亏损行为。

  总之,MiniMax的定价策略并非“烧钱换市场”。作为一家上市公司,MiniMax在2026年1月9日登陆港交所时曾超额认购1837倍,筹资48亿港元。这种市场认可度来源于对其技术实力和商业前景的信任,而非单纯的资金补贴。

  字节跳动的三模齐发战略体现了其一贯的“流量+场景”饱和式攻击能力。豆包2.0作为旗舰语言模型,Seedream 5.0主攻图像生成,SeedDance 2.0聚焦视频生成,三者形成完整的多模态矩阵。在应用端,豆包正在逐步接入抖音电商,2026年有望在海外拓展以及生态闭环方面取得更大突破。字节的逻辑很清晰——通过多模态能力覆盖用户的全部场景需求,然后用流量优势实现快速渗透。

  阿里选择将Qwen 3.5与30亿元千问红包奖励计划结合,本质上是“电商闪购+模型+流量”的组合拳。阿里C端已开启加速争夺AI原生用户入口,2025年12月成立千问C端事业群,当月千问、蚂蚁阿福、灵光流量均实现高增长。更重要的是,阿里试图把淘宝、支付宝、飞猪、高德等生态能力接入千问App,再用“任务助理”去承接复杂任务,试图把AI变成新的“生意入口”,堪称“AI让天下没有难做的生意”。

  智谱GLM-5将参数规模从3550亿扩展至7440亿,这一超大参数路线体现了“技术领先+智能政务”的差异化战略。智谱成为南北方公共服务平台争抢的“香饽饽”。在B端,智谱专注于打造标杆案例,积累成功经验以证明其技术实力和市场价值。

  DeepSeek的V4版本延续了其“推理降本”的技术路线,内部测试显示其在代码生成和长上下文处理能力上优于现有主流模型。DeepSeek的差异化在于始终坚持开源生态和技术极客定位,试图通过技术突破而非市场推广来实现竞争。

  MiniMax的方向与上述所有企业都不同——它不追求参数规模的极致,而是专注于“Agent场景的生产力落地”。M2.5被明确定位为“原生Agent生产级模型”,所有核心能力提升都围绕编程、工具调用、办公生产力等高价值经济任务展开。这种专业化路径的选择,体现了MiniMax对商业化落地的深刻理解。

  MiniMax创始人闫俊杰曾指出:“更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。”这一理念决定了MiniMax的资源配置逻辑——首先确保模型能力的持续提升,然后让产品成为能力外溢的自然结果,而不是为了追求产品覆盖而分散模型研发资源,这是与BAT、字节大厂最大的不同。

  在Agent生产级应用这一细分领域,M2.5的技术指标(80.2%SWE-Bench Verified、59.0% GDPval-MM胜率)和成本优势(1美元/小时)使其具备了明确的差异化竞争力。如果这一专业化定位能够持续深化,MiniMax有望在该赛道建立类似Claude在编程Agent领域的品牌认知、价值重塑。

  2月12日,MiniMax上线旗舰编程模型MiniMax M2.5,性能比肩国际顶尖模型,支持全栈编程开发,股价随之上涨。该模型专注Agent场景,性能成本双突破,已在全球开源。专家认为,这标志着AI商业化进入新阶段,将推动行业向更高效、更低成本发展。春节期间,AI企业纷纷布局Agent,行业正从“拼参数”转向“拼营收”,竞争更场景化、细分化。

  2月12日,MiniMax正式上线最新旗舰编程模型MiniMax M2.5。据悉,作为全球首个为Agent(智能体)场景原生设计的生产级模型,其编程与智能体性能(Coding&Agentic)比肩国际顶尖模型,直接对标Claude Opus 4.6,支持PC(个人电脑)、App(应用程序)、跨端应用的全栈编程开发。

  就MiniMax M2.5这一模型的性能,快思慢想研究院院长田丰对《每日经济新闻》记者表示,从M2.5的定位来看,它是“原生Agent生产级模型”,其核心价值在于为Agent场景提供可靠的任务文本理解和复杂问题长程推理能力。

  “在编程、工具调用、复杂任务拆解等Agent核心能力上,M2.5已经达到全球SOTA(State of the Art,最先进的)水平,这些能力是构建高效Agent的基石。”田丰表示。

  就行业集体押注Agent的原因,王鹏认为,其背后本质是技术范式从“被动响应”向“主动执行”的跃迁。

  “传统大模型如同‘知识库’,而Agent更像‘数字员工’,能拆解任务、调用工具、处理异常,甚至自我优化。这种转变源于企业需求升级:用户不再满足于获取信息,而是要求AI直接完成工作闭环(如自动处理订单、生成财报)。”王鹏说。

搜索