Gemini 3 Deep Think:Google推出AI“深度思考”高级推理能力模式
Google正式向Ultra高级用户发布Gemini 3 Deep Think模式,支持多路径并行推理、大幅提升在数学、科学与复杂代码场景下的解题和规划能力,在ARC-AGI-2等高难基准测试表现突出,可多轮自反复分析但推理速度较慢、资源消耗更大,目前定位高价值场景的付费高级服务。
阅读原文Google正式向Ultra高级用户发布Gemini 3 Deep Think模式,支持多路径并行推理、大幅提升在数学、科学与复杂代码场景下的解题和规划能力,在ARC-AGI-2等高难基准测试表现突出,可多轮自反复分析但推理速度较慢、资源消耗更大,目前定位高价值场景的付费高级服务。
阅读原文Meta计划对Reality Labs元宇宙业务进行高达30%的大规模预算缩减,或将裁员,并将资源更多转向AI模型与智能眼镜等业务,标志着Meta自2021年更名后首次全面战略调整,反映出元宇宙落地遇冷、AI投资成为优先发展方向,华尔街对此举表示欢迎。
阅读原文Anthropic与企业级数据云平台Snowflake达成价值2亿美元的多年代合作,将Claude Sonnet 4.5等模型作为Snowflake Intelligence内置AI引擎,为客户提供安全的企业AI能力,包括文本、图片等多模态数据分析、AI智能体开发等服务,彰显Anthropic聚焦大客户市场、力求AI与数据安全深度融合的发展战略。
阅读原文NeurIPS 2025颁布年度七大奖项,聚焦AI模型输出同质化(人工蜂群效应)、门控注意力机制大幅提升多模型能力、超深层(1000层+)自监督强化学习模型实现性能飞跃、扩散模型防止记忆训练集等,部分创新已被Qwen等模型产业化采纳,为后续LLM差异化输出与持续进化奠定理论基础。
阅读原文Anthropic等团队评测十款边界大模型在405个历史智能合约漏洞集上发现AI可自动复现约207个漏洞攻击,总额达5.5亿美元的模拟资金“窃取”,并能发现未公开的新型漏洞,显示AI已具备接近人类的利用逻辑漏洞能力,对金融区块链安全、AI治理等提出紧迫挑战。
阅读原文基于OpenRouter平台100万亿token使用分析,推理/连贯型模型已占一半实际推理任务份额,近1/3市场份额由开源大模型(中国模型推动明显)占据,社区“角色扮演”场景远超编程/写作需求,具备高复用粘性,表明推理能力、细分用例与模型多样化成为主流市场关注点。
阅读原文苹果公司宣布AI主管、UI设计负责人及法律/政策高管集体退休,核心职位由谷歌Gemini与Meta高管接替,并将AI团队并入Craig Federighi领导的软件部门,释放出面对AI竞赛压力、加快AI能力转型、吸纳外部行业资源的强烈信号。
阅读原文新发布SUSVIBES安全基准对比多款主流AI编程体,发现即使能生成功能正确代码,自动化代码却仅有约1/6为安全合规实现,关键如注入漏洞等易被忽视,且简单prompt工程难以提升安全性,警示安全需作为AI编程体内核目标而非外部补丁设计。
阅读原文前沿AI模型在安全运维数据集Splunk BOTSv3上完成一系列攻防自动化分析任务,其中GPT-5.1与Opus 4.5准确率达63%,Opus成本高但速度快,Gemini模型多任务未完成,表明不同大模型在安全自动化能力、安全运维场景表现存在明显分化。
阅读原文在与《纽约时报》和多家出版商的版权纠纷案中,美国法院裁定OpenAI需限时公开约2000万条匿名ChatGPT聊天日志,AI训练数据版权、隐私保护与AI生成内容合法性成为博弈核心,料将推动大模型数据来源合规化进程并影响行业数据治理政策。
阅读原文数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。