返回往期
2026年1月16日星期五
10 点要闻3 分钟阅读

今日要闻

1

Google Cloud让BigQuery用SQL托管推理开源模型(预览)

云服务数据平台推理部署

Google Cloud在BigQuery推出“托管且SQL原生”的开源模型推理能力(Preview),可直接使用Hugging Face与Vertex AI Model Garden中的模型。用户通过CREATE MODEL部署并自动管理资源,闲置时可自动回收以控成本;同时可在SQL里配置机型与副本数,并用AI.GENERATE_TEXT/AI.GENERATE_EMBEDDING做批量推理,把模型生命周期管理收敛到BigQuery工作流内。

阅读原文
2

Google开源TranslateGemma:覆盖55语种,12B超越27B基线

开源模型机器翻译多语种

Google发布开源翻译模型套件TranslateGemma,覆盖55种语言并保留多模态能力,面向不同部署环境提供4B(移动端)、12B(笔记本)与27B(云端)三种规模。官方称12B在WMT24++基准中以MetricX衡量的质量超过Gemma 3 27B基线。模型通过两阶段微调提炼Gemini能力,并结合MetricX-QE与AutoMQM等奖励模型进行强化学习优化。

阅读原文
3

Black Forest Labs发布FLUX.2 [klein] 4B:13GB显存<0.5秒

开源模型图像生成端侧推理

Black Forest Labs发布FLUX.2 [klein]模型家族,主打“交互式视觉智能”的实时生成与编辑。其4B版本采用Apache 2.0开源许可,支持文本生成图像与多参考图像编辑,可在约13GB显存的消费级GPU(如RTX 3090/4070)上运行,端到端推理低于0.5秒;同时提供9B版本及与NVIDIA合作的FP8/NVFP4量化版本,进一步降低显存占用并提升速度,并强调C2PA与多重安全缓解。

阅读原文
4

Kyutai开源Pocket TTS:5秒样本本地语音克隆,1亿参数

语音AI开源隐私计算

Kyutai实验室开源Pocket TTS语音克隆TTS模型,可在普通笔记本电脑上本地运行,无需GPU或云服务;仅用约5秒音频样本即可复制语调、口音与情感。模型基于连续音频语言模型(CALM)框架,参数量约1亿,在Apple M3或Intel Core Ultra CPU上可实时运行;邮件摘要称其词错误率低至1.84%,并以MIT许可开源训练代码与约8.8万小时公开数据,面向医疗、法律等敏感场景强调隐私与可控部署。

5

Cloudflare收购Human Native:押注AI数据授权与机器对机器支付

并购数据与版权基础设施

Cloudflare宣布收购Human Native,目标是把非结构化内容转为高质量、可授权的AI训练与检索数据,并推动“内容所有者可控访问与补偿”的新互联网经济模型。Cloudflare提到将构建面向AI开发者的“AI索引”与发布/订阅式内容更新机制,以替代传统爬取;同时与x402 Foundation、Coinbase合作探索机器对机器交易协议,为自动化系统购买数字资源与数据访问提供支付基础设施。

阅读原文
6

GitHub Copilot引入可验证记忆系统,PR合并率A/B提升7%

开发者工具Agent软件工程

GitHub披露为Copilot构建“智能体记忆”系统:可选开启后,智能体会把仓库中的约定与事实作为记忆存储,并为每条记忆附带代码位置引用,通过即时验证确保记忆随代码演进不过时;记忆还可在编码与代码审查等不同智能体间共享,实现知识转移。GitHub称A/B测试显示,编码智能体的拉取请求合并率提升7%,代码审查智能体的正面反馈增加2%,用于提升一致性与减少重复错误。

阅读原文
7

Android Studio Otter 3更新:BYOM+增强Agent Mode+自然语言UI测试

IDEAgent移动开发

Google发布Android Studio Otter 3 Feature Drop,强化AI辅助开发体验:支持BYOM(自带模型),可接入远程LLM或通过LM Studio、Ollama使用本地模型;Agent Mode增强,可在设备上运行并交互应用、通过变更抽屉审查修改、管理多线程对话;新增Journeys,用自然语言编写端到端UI测试;支持连接Figma、Notion等远程MCP服务器;同时加入截图生成Compose代码与Logcat自动反混淆等功能。

阅读原文
8

研究披露Reprompt攻击:单次点击可从Microsoft Copilot外泄数据

安全提示注入企业AI

安全研究人员披露“Reprompt”攻击,可通过一个恶意链接实现对Microsoft Copilot等聊天工具的数据外泄,宣称可绕过企业安全控制。攻击利用Copilot URL中的“q”参数注入指令,诱导模型重复执行并与攻击者服务器持续交互,实现隐蔽外传;报道还称即使用户关闭会话,操控仍可能持续。微软已修复相关问题,并表示企业版Microsoft 365 Copilot不受影响;研究提示企业需加强对链接与提示注入的分层防护。

阅读原文
9

AI视频公司Higgsfield扩展A轮至1.3亿美元,估值达13亿美元

融资生成式视频创业公司

AI视频生成初创公司Higgsfield宣布将A轮扩展融资新增8000万美元,使A轮总额达到1.3亿美元,公司估值超过13亿美元。TechCrunch称其成立约5个月用户达1100万、9个月超过1500万,年化收入运行率达2亿美元且两个月内翻倍。公司面向消费者与内容创作者提供视频生成与编辑工具,本轮由Accel、AI Capital Partners、Menlo Ventures和GFT Ventures等参与,资金将用于研发、团队与市场扩张。

阅读原文
10

OpenAI与Cerebras签超100亿美元算力协议:最高750MW至2028

算力AI芯片合作

多家媒体称OpenAI与Cerebras Systems达成多年协议,总金额超过100亿美元,未来三年购买最高750兆瓦的超低延迟计算能力,并在2026年至2028年分阶段上线,用于加速ChatGPT等模型推理与实时交互。报道引述Cerebras说法,其晶圆级系统在部分LLM响应速度上可达GPU系统的约15倍;交易也被解读为OpenAI算力来源多元化、以及Cerebras降低对单一大客户依赖并为潜在IPO铺路的关键订单。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。