MiniMax发布M2.1模型,编码与多语言能力大幅提升
MiniMax正式发布M2.1大模型,采用稀疏MoE架构,200K上下文窗口,10B激活参数,主打多语言编程、复杂任务处理和高效推理,支持多种主流编程语言和Web3协议,Benchmarks如SWE-bench Multilingual、VIBE等多项测试超越Claude Sonnet 4.5、Gemini 3 Pro等闭源模型,API已上线并支持本地部署,定价为Claude 4.5 Sonnet的8%。
阅读原文MiniMax正式发布M2.1大模型,采用稀疏MoE架构,200K上下文窗口,10B激活参数,主打多语言编程、复杂任务处理和高效推理,支持多种主流编程语言和Web3协议,Benchmarks如SWE-bench Multilingual、VIBE等多项测试超越Claude Sonnet 4.5、Gemini 3 Pro等闭源模型,API已上线并支持本地部署,定价为Claude 4.5 Sonnet的8%。
阅读原文智谱AI发布新一代旗舰大语言模型GLM-4.7,主打工程场景下的稳定性、长任务处理和多语言编程,SWE-bench、LiveCodeBench、Terminal Bench等多项基准测试表现优异,综合性能超越GPT-5.2等闭源模型,支持200K上下文,已成为GLM Coding Plan默认模型,开源权重已上线Hugging Face。
阅读原文OpenAI最新FrontierScience评测显示,GPT-5.2在“Google-Proof”科学基准上得分92%,显著超越70%专家基线,在奥赛类推理(77%)和复杂开放式研究任务(25%)均领先Claude Opus 4.5、Gemini 3 Pro等,初步验证其加速科学研究的能力。
阅读原文OpenAI在Codex中推出Skills功能,基于Anthropic主导的Agent Skills开放规范,支持开发者通过预设包或自然语言自定义脚本扩展AI编码代理能力,已与微软、GitHub、Cursor等多平台实现互通,推动AI开发工具生态标准化。
阅读原文Google正式发布Gemini 3 Flash模型,主打超高速、低成本和多模态(文本、图片、音频、视频)处理,推理速度为2.5 Pro的3倍,API定价大幅降低,已成为Gemini App、AI搜索等产品的默认模型,适用于高频实时场景。
阅读原文2025年AI行业主线从参数竞赛转向应用创新与产业落地,开源大模型如DeepSeek、GLM-4.7、MiniMax M2.1等在多项基准测试追赶甚至超越闭源模型,Agentic AI、标准化协议(如MCP、Agent Skills)、多模态生成、硬件基础设施优化成为年度关键词,企业关注点从单一性能指标转向实际应用与ROI。
阅读原文阿里通义Qwen3-TTS家族推出音色创造模型Qwen3-TTS-VD-Flash和音色克隆模型Qwen3-TTS-VC-Flash,支持复杂自然语言指令定制音色、3秒级音色克隆及10种主流语言生成,综合表现优于GPT-4o-mini-tts、MiniMax等,显著提升多语种TTS能力。
阅读原文Zoho推出自研Zia LLM套件,主打企业财务自动化与隐私保护,采用1.3B-7B参数多规格模型,集成MCP协议,支持700+业务动作,性能在结构化数据提取等任务上超越Llama 3-8B,计划年底扩展至100B参数,推动“垂直AI”与自动化财务新标准。
阅读原文Nvidia宣布以约200亿美元收购AI芯片初创公司Groq的全部资产(不含云业务),Groq创始团队将加入Nvidia,Groq以TPU架构和低延迟推理芯片著称,此举为Nvidia史上最大收购,进一步巩固其AI推理芯片市场主导地位。
阅读原文2025年AI开发者生态聚焦Agentic CLI、MCP协议、Agent Skills等标准化基础设施,开源模型如GLM-4.7、MiniMax M2.1、DeepSeek V3.2等在工程化、长上下文和多模态能力上追赶闭源,企业关注点转向实际应用、ROI与多场景落地,AI工程化与产业协同成为主流趋势。
阅读原文数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。