返回往期
2026年3月1日星期日
8 点要闻3 分钟阅读

今日要闻

1

AWS Bedrock上线OpenAI兼容Projects API

云服务API企业AI

Amazon Bedrock宣布在Mantle推理引擎中提供与OpenAI兼容的Projects API,允许客户为多个应用、环境或团队创建相互隔离的“项目”,以减少跨团队调用混用与权限错配。该API面向使用OpenAI兼容接口的用户(含Responses与Chat Completions),并支持通过IAM做基于访问控制与标签管理,提升权限治理与成本可见性。AWS表示该能力无需额外费用,仍按模型推理用量计费,相关文档已发布。

阅读原文
2

谷歌Nano Banana 2生图:14图参考、4K输出

多模态图像生成产品发布

谷歌发布图像生成模型Nano Banana 2,材料称其基于Gemini 3.1 Flash Image构建,重点从“像素拟合”转向更强的逻辑理解与可控编辑。功能包括:在遮挡、折射、重力等物理关系上减少生成错误;提升多语言文字与信息图、UI原型等复杂图文渲染能力;角色/风格一致性提升至95%以上,并支持最多14张参考图的多图条件生成。模型支持对话式编辑与局部修改,可原生输出2K到4K分辨率,用户可在Gemini平台Fast模式调用。

阅读原文
3

DeepMind提Unified Latents:ImageNet FID 1.4

研究生成模型扩散模型

Google DeepMind提出Unified Latents(UL)框架,用扩散先验与解码器对潜在表示进行联合正则化,试图缓解潜在扩散模型在重建质量与建模复杂度之间的权衡。其方法包含固定高斯噪声编码、先验对齐与重加权解码器ELBO,并采用两阶段训练:先联合训练编码器/扩散先验/解码器学习潜在表征,再冻结编码器与解码器以训练更大的“基础模型”提升生成质量。材料称其在ImageNet-512达到FID 1.4,在Kinetics-600达到FVD 1.3,并强调训练计算更高效。

阅读原文
4

OpenAI与五角大楼新协议:模型可进机密网部署

政策与治理国防AI安全

多家媒体报道OpenAI与美国国防部达成新协议,允许美军在其机密网络中部署OpenAI模型。OpenAI CEO Sam Altman表示协议包含“技术保障措施”,明确禁止用于国内大规模监控,并禁止完全自主武器系统,强调人类必须对武力使用负责;公司将构建相应的安全防护栈并派工程师协助落地与安全运行。Altman同时呼吁国防部为所有AI公司提供一致条款,以形成可执行的行业合作边界。该进展发生在政府与其他AI供应商合作争议升温的背景下。

阅读原文
5

Sakana AI推Doc-to-LoRA:单次前向生成适配器

LoRA模型定制研究

Sakana AI被报道提出Doc-to-LoRA思路:通过训练超网络(hypernetwork)在一次前向传播中生成LoRA适配器,实现“即时权重更新”,以摊薄定制化成本。该方法旨在把外部事实文档更直接地内化到适配器权重中,在不依赖长上下文窗口的情况下提升对超出基础模型上下文长度序列的准确性,并降低持续检索与长上下文推理带来的服务成本。材料将其定位为企业面向特定文档、流程或知识库进行快速模型适配的一类工程化路径。

阅读原文
6

Databricks提出OAPL:训练生成量降至1/3

训练方法强化学习推理模型

Databricks被报道提出OAPL(Off-policy reinforcement learning相关方法),作为推理型模型训练中GRPO一类流程的替代选择,强调以更稳定的离策略(off-policy)方式降低训练生成与采样成本。材料称其在对齐与推理能力上可达到与对标方法相当的效果,但所需训练“生成量”约减少到三分之一,从而降低训练阶段的吞吐与算力压力,也简化大规模训练的运维复杂度与失败重试成本。该方向反映行业在推理模型扩张期对“更少样本、更高稳定性”训练范式的需求。

阅读原文
7

vLLM为ROCm增7个attention后端:解码最高快4.4倍

推理加速ROCm开源生态

材料称vLLM在ROCm生态中新增7个attention后端,以提升AMD GPU上的高性能推理效率,并给出“解码吞吐最高提升4.4倍”的量化结果。该类优化通常直接影响长序列解码阶段的成本与延迟,对在线对话、代理式工作流等以decode为主的负载更敏感。报道将其解读为非英伟达平台的软件栈正在补齐:当云厂商与企业更多评估总体拥有成本(TCO)时,推理框架对不同硬件的后端适配与内核优化,可能成为AMD等平台扩大部署份额的关键变量。

阅读原文
8

OpenAI解雇员工:涉用机密信息参与预测市场交易

公司治理合规安全

邮件汇总信息称,OpenAI解雇了一名员工,原因是其被发现使用公司机密信息参与预测市场交易。材料未披露涉及的具体市场、交易规模或时间线,但该事件指向前沿AI公司在高频发布与融资、政策合作等敏感事项密集期的合规与内部控制挑战:一方面需要强化对“重大非公开信息”的访问权限与审计;另一方面也要求对员工参与外部金融/投注平台的行为边界给出更清晰的制度约束,以降低内幕信息滥用与声誉风险。

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。