返回往期
2026年2月6日星期五
9 点要闻3 分钟阅读

今日要闻

1

OpenAI发布GPT-5.3-Codex,速度提升25%并强化网安防护

模型发布AI编程安全

OpenAI推出代理式编码模型GPT-5.3-Codex,结合上一代Codex的代码能力与GPT-5.2推理/知识能力,并将运行速度提升25%。官方称其在SWE-Bench Pro、Terminal-Bench等基准创下新高,可在终端与网页环境中自主完成开发、审查与调试等长流程任务,并支持协作引导。OpenAI首次将其归类为“高能力”网络安全模型,配套更强安全措施,并提供1000万美元API信用的网络安全资助计划。现已在付费ChatGPT及应用、CLI、IDE插件等渠道上线,API后续开放。

阅读原文
2

Anthropic发布Claude Opus 4.6,开放1M上下文窗口beta

模型发布长上下文企业AI

Anthropic发布旗舰模型Claude Opus 4.6,重点提升编码、推理与知识工作稳定性,并首次为Opus级模型提供100万token上下文窗口(beta)。新版本在Terminal-Bench 2.0、Humanity’s Last Exam、GDPval-AA等评测中取得领先成绩,同时在API侧引入“自适应思考”、推理“努力程度”控制、上下文压缩等能力,便于长程任务与成本控制。模型已在claude.ai、API及主要云平台上线,定价维持每百万输入/输出token 5/25美元,超长上下文另收溢价;并同步更新Claude in Excel与PowerPoint研究预览功能。

阅读原文
3

OpenAI推出Frontier企业代理平台,HP与Oracle等先行试点

企业服务AI智能体平台

OpenAI发布企业级平台OpenAI Frontier,用于构建、部署与管理可执行实际工作的AI代理。平台支持将代理连接到外部数据与应用,并通过权限与行为控制、类似“入职/反馈”的管理机制持续优化代理表现。官方披露HP、Oracle、State Farm、Uber等为试点客户,目前仅向部分用户开放,未来数月扩大覆盖。该发布被视为OpenAI在企业代理基础设施上的关键补位,直接对标Salesforce Agentforce、LangChain与CrewAI等生态。价格与更细的技术实现细节暂未披露。

阅读原文
4

快手可灵Kling 3.0全球全面上线,视频/图片与Omni版齐发

生成视频产品上线

快手宣布Kling(可灵)3.0系列于2月5日全球全面上线,产品包含可灵视频3.0、可灵视频3.0 Omni、可灵图片3.0及图片3.0 Omni。官方强调新版本提升叙事与分镜控制能力、生成一致性,并针对画面崩坏、文字变形等问题做了改进;Omni版本侧重更强的编辑与重绘能力,面向替换主体、延展镜头等工作流。相较此前的内测阶段,本次为“全面上線/正式上线”的可用性升级,意味着创作者与企业可在同一套模型家族中覆盖生成与编辑两类需求。

阅读原文
5

ElevenLabs融资5亿美元估值110亿美元,语音AI进入“独角兽密集区”

融资语音AI

语音AI公司ElevenLabs完成新一轮融资,筹集5亿美元,投后估值约110亿美元,领投方为红杉资本。报道同时披露公司自2022年成立以来累计融资已达7.81亿美元。本轮大额融资凸显资本对语音生成与语音交互赛道的持续押注,也为其在模型训练、产品化与企业级语音基础设施上的扩张提供弹药。由于语音产品通常直接面对内容创作、客服与代理式交互等高频场景,资金用途预计将围绕算力、数据与渠道扩展展开,但摘要未披露具体资金分配与营收指标。

阅读原文
6

亚马逊宣布今年AI投入2000亿美元,较去年1250亿美元大增

算力与数据中心资本开支

BBC报道,亚马逊宣布今年将投入2000亿美元用于AI项目与相关基础设施建设,显著高于去年的1250亿美元,成为当前大厂中最激进的资本开支计划之一。消息发布后,亚马逊股价在盘后交易中下跌约10%,显示市场对高投入、回报周期与利润压力仍偏谨慎。报道同时提到,Meta、Google与Microsoft等巨头也在扩大AI投入,预计这些公司在2026年合计投入约6500亿美元。该趋势将继续推高算力、数据中心与供应链需求,并加剧大模型与云服务竞争。

阅读原文
7

Databricks为MLflow加入MemAlign,降低LLM评估成本与延迟

开发工具评估与治理企业AI

Databricks的Mosaic AI研究团队在MLflow中加入MemAlign框架,目标是降低基于LLM的评估系统在训练与迭代中的成本与延迟。MemAlign采用“双内存”设计:将通用评估原则存入语义内存,把任务特定反馈以自然语言形式存入可扩展向量数据库的情景内存,从而减少对大规模标注数据集与反复微调的依赖,并支持反馈更新与删除以避免“修一个问题引出更多问题”。报道称其测试效果可达到与使用标注数据集相当的效率,后续还将集成到Agent Bricks的Judge Builder以增强代理评估与治理。

阅读原文
8

Sapiom获1500万美元种子轮,做“AI代理支付/采购”基础设施

融资AI智能体支付与权限

TechCrunch报道,初创公司Sapiom完成1500万美元种子轮融资,由Accel领投,Okta Ventures、Array、Menlo、Anthropic与Coinbase Ventures等参投。公司目标是为AI代理提供金融基础设施,使其能自动、安全地购买与接入软件、API、数据和计算资源,解决代理在外部服务认证与付款上高度依赖人工配置的瓶颈。Sapiom当前聚焦企业级B2B场景,强调让非技术开发者在构建代理工作流时更易完成“后端集成”。该方向与代理规模化落地密切相关:当代理能自主触发采购与授权,企业的权限治理、可审计支付与风险控制将成为刚需能力。

阅读原文
9

AI聊天应用Chat & Ask AI曝数据泄露,约3亿条对话记录可被访问

安全事件数据泄露应用生态

媒体披露,AI聊天应用“Chat & Ask AI”因后端Google Firebase数据库配置错误,导致约3亿条用户聊天记录暴露,涉及超过2500万用户。泄露数据包含完整对话内容、时间戳、用户自定义机器人名称及所选模型等敏感信息;样本中出现自杀、制毒与黑客等高风险话题。报道指出该应用自身不训练模型,而是作为接口连接OpenAI、Anthropic、Google等模型服务,但其对话数据由自身存储与管理,因此成为安全薄弱环节。该事件再次提示:即便底层模型提供方合规,第三方“壳应用”的数据治理与默认存储策略仍可能放大隐私与安全风险。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。