英伟达财报超预期:营收681.3亿美元、指引780亿美元
英伟达公布2026财年第四季度业绩:营收681.3亿美元同比增73%,数据中心收入623亿美元同比增75%,占总营收91%以上;非GAAP每股收益1.62美元。公司指引下一季度营收约780亿美元(±2%),并称已在指引中排除中国市场潜在收入。网络设备销售额同比增263%至109.8亿美元,显示NVLink与Spectrum‑X需求上行;Vera Rubin系统计划于今年下半年量产,宣称性能将提升10倍。
阅读原文英伟达公布2026财年第四季度业绩:营收681.3亿美元同比增73%,数据中心收入623亿美元同比增75%,占总营收91%以上;非GAAP每股收益1.62美元。公司指引下一季度营收约780亿美元(±2%),并称已在指引中排除中国市场潜在收入。网络设备销售额同比增263%至109.8亿美元,显示NVLink与Spectrum‑X需求上行;Vera Rubin系统计划于今年下半年量产,宣称性能将提升10倍。
阅读原文多家消息称,AMD与Meta达成多年、多代AI基础设施协议,规模最高达6GW的Instinct GPU部署,交易金额被报道超过1000亿美元。披露的条款还包括:Meta获得最多1.6亿股AMD股票的认股权证,行权条件与采购量及股价目标挂钩;首批1GW部署预计在2026年下半年启动,并可能包含为Meta工作负载定制的MI450 GPU与EPYC Venice CPU首发合作。该协议被视为AMD争夺超大规模客户、冲击英伟达主导地位的重要筹码。
阅读原文蚂蚁集团 inclusionAI 团队发布并开源百灵大模型两款万亿参数模型Ling-2.5-1T(即时)与Ring-2.5-1T(思考)。其核心为“1:7”混合线性注意力架构:每8层中1层保留Softmax注意力、7层采用线性注意力,将访存规模降至传统架构的1/10、生成吞吐提升至3倍,并支持最长1M tokens上下文。材料称Ling-2.5-1T在长文本与指令遵循任务领先,Ring-2.5-1T面向重推理场景强化,展示混合线性注意力在万亿规模落地的工程路径。
阅读原文Anthropic宣布收购Vercept,以推进Claude的computer use(在真实软件中感知与交互)能力。官方称,Claude Sonnet 4.6在OSWorld评测的电脑使用能力达到72.5%,相比2024年底不足15%有显著提升。Vercept由Kiana Ehsani、Luca Weihs与Ross Girshick联合创立,聚焦多步骤任务中对界面与工具链的稳定交互;收购后Vercept将逐步停止对外产品服务,团队并入Anthropic。Anthropic表示该整合将用于提升跨应用流程执行、代码库操作与多源研究整合等能力。
阅读原文报道称美国国防部向Anthropic发出“最后通牒”,要求其在指定期限前同意放宽Claude在军事场景的使用限制,否则可能被列为供应链风险,甚至面临依据《国防生产法》被迫配合的压力。争议焦点在于Anthropic长期拒绝将模型用于全自主武器系统与大规模国内监控。材料同时提到五角大楼此前向包括Anthropic在内的多家模型公司授予单份最高可达2亿美元的合同,国防侧正加速推动大模型进入机密网络与作战支持流程。
阅读原文Inception发布Mercury 2,定位为基于扩散模型的推理LLM,通过并行生成/反复精炼替代自回归逐token解码,以降低端到端延迟并提升吞吐。在NVIDIA Blackwell GPU上,其输出速度据称可达1009 tokens/s。材料给出的定价为每百万输入token 0.25美元、输出0.75美元,并支持128,000 token上下文、原生工具调用与schema兼容的JSON输出。Mercury 2已开放早期访问并提供在线聊天演示,官方宣称其在SciCode、IFBench、AIME等基准表现靠前。
阅读原文订阅材料称,OpenAI为Responses API新增WebSocket模式,允许客户端通过持久连接实时接收模型生成的token流,减少传统HTTP轮询与短连接带来的延迟与状态管理成本。该能力面向低延迟聊天、编程协作与多人交互等场景,可用于把“生成—展示—继续生成”的体验做成更连续的流式输出,并更易在前端实现打断、续写与实时工具调用编排。材料未给出价格变化或具体上线地区限制,但强调其作为开发者侧的实时传输选项,意在提升交互响应与工程集成效率。
多家报道指Anthropic扩大Claude Cowork在企业侧的能力,推出面向高价值工作流的插件与连接器,并支持企业建立私有插件市场。连接器覆盖Google Workspace、Slack、DocuSign、FactSet等常见系统,也提到与LSEG、Salesforce等合作场景;管理员可集中管理权限、监控使用情况与成本,降低跨系统调用的治理难度。报道将其定位为让Claude从“聊天”走向“可编排工作流”的代理层,并强调Anthropic意图融入企业现有软件栈而非替代。材料未给出官方定价与具体可用范围。
阅读原文芯片初创公司MatX宣布完成5亿美元B轮融资,由Jane Street与Situational Awareness领投。公司开发面向大语言模型的MatX One处理器,主打“可拆分脉动阵列(splittable systolic array)”以适配动态工作负载;其方案将SRAM用于存放模型权重以追求低延迟,并结合HBM承载KV cache以支持长上下文,同时结合推测解码与块稀疏注意力等优化。MatX表示新资金将用于完成芯片设计并推进制造,目标在一年内流片,切入训练与推理边界逐渐模糊的算力市场。
阅读原文纽约AI会计初创公司Basis宣布完成1亿美元B轮融资,估值11.5亿美元,领投方为Accel,参投包括GV等。公司成立于2023年,聚焦用代理式AI自动化客户账务、税务申报与审计等流程,报道举例其可自动完成1065税表等复杂任务,并称其技术依托OpenAI等大模型以支持长时间自主运行。Basis披露已与“前25大会计公司”中约30%建立合作关系。公司表示融资将用于加速平台研发并扩充工程与机器学习团队,以应对会计行业长期人才短缺带来的需求。
阅读原文数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。