21世纪经济报道记者邓浩上海报道
自从年初Deepseek R1开源模型“掀桌”以来,接入Deepseek成为几乎所有下游AI应用厂商的选择,甚至有部分资本市场人士感叹大模型的战争已经结束了。
事实果然如此吗?
7月26日,大模型六小虎之一的MiniMax创始人、CEO闫俊杰在2025世界人工智能大会(WAIC)首日的主题演讲上给出了自己的回答,“我们认为,AI领域一定会有多个玩家持续存在。”
多玩家并存
在闫俊杰看来,AI 一定会被掌握在多家公司的手中,其中有不少可以自洽的逻辑。
首先,由于所有模型,都依赖对齐(Model Alignment),模型不同,对齐目标也会不一样。其举例称,有的模型对齐目标是一个靠谱的程序员,那么做 Agent 就会特别的强;有的模型它对齐目标是与人的交互,那么它就会比较有情商,能够做流畅的对话;有的模型可能会充满想象力。因此,这或许可以给模型带上属于开发者自己的价值观和思想偏好。
(图片来源:MiniMax官方微信公众号)
其次,闫俊杰透露,MiniMax最近半年用的AI系统其实都已经不是单个模型了,而是一个多Agent系统,里面涉及多个模型,不同的模型也可以使用不同的工具,通过这样的方式让AI智能水平越来越高,能够解决越来越复杂的问题。“这个东西带来的结果是,单一模型的优势在这样一个多Agent 系统里逐渐变弱。”
最后,闫俊杰认为是过去一年开源模型如雨后春笋般涌现,开源模型变得越来越有影响力。最好的开源模型越来越多,同时也在不断逼近最好的闭源模型。
无独有偶,不久前,月之暗面推出了Kimi K2基础大模型,并且选择了开源,引发资本市场的一波热炒。华西证券评价称,相较过去的基座模型,K2更强调代码能力和通用Agent任务能力。在多个标准测试集下,具备与OpenAI和Anthropic旗下大模型接近的能力。
AI普惠是未来
6月,MiniMax已经推出了号称世界上第一个开源的大规模混合架构的推理模型MiniMax-M1,被业内视为面对DeepSeek R1强劲竞争给出的回应。
在以闪电注意力机制为主的混合架构帮助下,MiniMax推算,在生成长度为10万tokens的场景下,MiniMax-M1的计算量(FLOPs)为DeepSeek R1的25%,在长文本处理任务中具备显著优势。
成本节约则更具优势,在进行8万Token的深度推理时,M1所需的算力仅为DeepSeek R1的约30%;生成10万token时,只需要后者的25%。
一个有趣的观察是,在过去一年半, 业内可使用算力显著增加的情况下,AI模型的大小却没有发生特别大的变化,比如前述的Kimi K2总参数达到1T,激活参数为32B。
闫俊杰认为,原因在于对所有实用模型而言,计算速度是一个比较关键的因素。如果模型计算速度特别慢,就会降低用户的使用意愿,所以所有公司都关注模型的参数量和智能水平之间的平衡。
此外,闫俊杰判断,通过大量的计算网络系统和优化算法,在接下来一两年之内,最好模型的推理成本可能还能再降低一个数量级。进而其认为训练单个模型的成本不会显著地增加。
不过,尽管技术演进优化或许可以让AI研发不再那么烧钱,但是算力使用可能还会继续飞速增长。
闫俊杰透露,“尽管 Token 会变得很便宜,但是使用 Token 的数量会显著增加。去年ChatBot单个对话只要消耗几千个Token,现在 Agent 单个对话可能消耗几百万个Token,并且因为AI解决的问题越来越复杂,越来越实用,那么用的人也会越来越多。”
亚金配资-股票网上配资平-如何带杠杆炒股-股市场外配资提示:文章来自网络,不代表本站观点。