返回往期
2026年3月7日星期六
10 点要闻3 分钟阅读

今日要闻

1

五角大楼将Anthropic列供应链风险并禁用Claude

政策监管AI安全军工

美国国防部宣布立即将Anthropic认定为“供应链风险”,要求军方及其承包商停止在相关系统中使用Claude。报道指该决定与Anthropic拒绝放松“不得用于大规模监控与自主武器”的产品限制有关,引发政府强硬回应。多家防务承包商被迫改用其他模型供应商;Anthropic称将采取法律行动寻求救济。

阅读原文
2

英伟达暂停中国版H200生产并转向Vera Rubin

算力半导体地缘政治

据韩媒报道,英伟达已暂停面向中国市场的H200芯片生产,原因是出口审批条件严格、销售迟迟未形成收入且未来出货不确定。公司将台积电产能从H200转投下一代“Vera Rubin”相关产品,以降低供应链波动与组件短缺风险。报道还称英伟达现有约25万颗H200库存,若政策放宽,恢复供应链可能仍需最长3个月。

阅读原文
3

Clinejection攻击链披露:提示注入导致NPM发布被攻破

AI安全供应链安全提示注入

研究者披露“Clinejection”供应链事件:攻击者在GitHub issue标题中植入提示注入内容,诱导具备工具权限的自动分诊代理执行命令。随后利用不同工作流共享的Actions缓存键实施node_modules投毒,并通过填满10GB缓存上限强制驱逐旧缓存,使高权限发布流程加载恶意依赖,进而窃取NPM发布密钥并产出被篡改的生产包。

阅读原文
4

GitHub开源AI安全审计框架Taskflows并发现多起CVE

AI安全开源安全审计

GitHub Security Lab开源一套AI驱动的代码安全审计框架,将审计拆解为多阶段“taskflows”,先做威胁建模与潜在问题枚举,再进行严格验证,以降低LLM幻觉与误报。该框架可通过GitHub Codespaces快速运行(需Copilot许可),面向开源社区复用。官方披露工具已在Outline、WooCommerce、Rocket.Chat等项目中识别出关键漏洞与真实CVE,覆盖授权绕过等逻辑缺陷。

阅读原文
5

小米开启系统级Agent“miclaw”封测:50+工具联动IoT

智能体终端AIIoT

小米发布系统级AI Agent“miclaw”并开启小范围封测,基于MiMo大模型在系统权限层集成执行能力,内置50+系统级工具,由推理-执行引擎自动编排调用顺序。其“感知-关联-判断-行动”链路可结合短信、日历等个人上下文做任务规划,并通过米家协议与MCP标准把执行边界延伸到全屋IoT设备。官方还强调其具备自我演化能力,可生成工具、记忆与子代理。

阅读原文
6

Databricks披露LogSentinel:LLM驱动PII识别将审查从数周降至数小时

数据治理企业AI隐私合规

Databricks公开内部系统LogSentinel,用LLM自动完成日志/表字段的PII识别与数据治理:先为字段生成描述并构建向量检索,从标注真值集中检索相似样例做动态few-shot提示,再通过多模型编排实现路由、回退与校验钩子,降低空标签与幻觉风险。分类结果直接进入脱敏、访问控制与整改流程,并在检测到漂移或策略违规时自动生成Jira工单,使周期性合规复核由数周缩短到数小时。

阅读原文
7

Liquid AI发布LFM2-24B-A2B与LocalCowork本地离线代理

本地模型智能体开源

Liquid AI发布稀疏MoE模型LFM2-24B-A2B及开源桌面代理LocalCowork,主打隐私优先的本地Agent工作流,并通过MCP调用工具。模型总参数240亿、推理每token激活约20亿;在Apple M4 Max上以Q4_K_M量化GGUF运行时内存约14.5GB,工具选择平均延迟约385ms。LocalCowork离线集成75个跨14个MCP服务器工具并记录本地审计日志;测试显示单步准确率80%,但多步端到端完成率仅26%。

阅读原文
8

腾讯混元提出HY-WU动态权重生成:实时生成LoRA参数“换脑”

模型结构参数高效微调研究

腾讯混元提出HY-WU(Weight Unleashing)范式:不再依赖固定权重点,而是训练一个参数生成器,依据输入条件实时合成并挂载LoRA等适配器参数,把“静态参数记忆”转为“功能记忆”。官方称该机制可缓解个性化适配中的灾难性遗忘与任务权衡,通过动态路由减少梯度冲突;在图像编辑等任务中展示生成参数的结构一致性。研究还给出尺度规律:随生成器深度与LoRA rank提升,效果继续增强。

阅读原文
9

InSpatio开源实时3D世界模型WorldFM:单卡4090可实时推理

世界模型具身智能开源

InSpatio宣布并开源实时交互3D世界模型InSpatio-WorldFM,主张以原生3D表征替代2D像素预测以获得空间智能。其“显式锚点+隐式记忆”结构通过前馈重建生成空间锚点,并结合生成模型的隐式记忆,缓解长时生成的遗忘与几何坍塌,支持理论上的无限时长一致生成。团队提出从海量2D视频中提取几何与物理规律的数据放大策略,并称经蒸馏与推理优化后可在单张RTX 4090上实时运行。

阅读原文
10

FlashAttention-4发布:为Blackwell重构使注意力逼近matmul速度

推理加速算子优化GPU

FlashAttention-4正式发布,面向NVIDIA Blackwell架构对注意力计算流水线做深度重构,以应对Tensor Core吞吐提升快于SFU与共享内存带宽的“非对称扩展”瓶颈。方案在前向中用多项式近似替代exp开销,并在反向通过TMEM中间结果复用与2-CTA MMA等设计减少共享内存流量,实现计算与IO更充分重叠。项目还采用Python版CuTe-DSL,在保留PTX级控制的同时将编译时间提升约20–30倍,并可与PyTorch FlexAttention结合快速原型化。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。