AI Daily Brief

2026年1月14日星期三

9 点要闻3 分钟阅读

今日要闻

百川智能开源Baichuan-M3，2350亿参数医疗模型

医疗AI大模型开源

百川智能于1月13日发布医疗场景大模型Baichuan-M3，披露参数规模2350亿，重点优化医疗幻觉控制与端到端问诊推理。公司称其在HealthBench/HealthBench Hard、医疗幻觉等评测中排名第一，并在自建问诊评测中超过人类医生表现。模型融合医学文献、临床指南、真实病历及药品知识库，支持疾病推理、用药建议与检验解读等能力；目前已开源并在“百小应”平台开放体验，面向辅助诊断与健康管理落地。

阅读原文

DeepSeek提出Engram条件记忆，瞄准HBM瓶颈

模型架构长上下文研究

DeepSeek创始人梁文锋与北大等发表论文提出Engram“条件记忆”模块，将静态知识的存储与计算解耦，通过可检索记忆表缓解GPU高带宽内存（HBM）容量限制，并提升长上下文处理效率。团队在一款270亿参数模型上验证，多个行业基准表现提升“几个百分点”。论文还给出经验配比：约75%资源用于推理计算、约25%用于记忆可取得更优效果，并认为条件记忆可能成为下一代稀疏模型的重要建模原语，服务成本效率导向的Scaling路径。

阅读原文

DeepMind更新Veo 3.1，新增9:16与4K超分

视频生成多模态产品更新

Google DeepMind更新视频生成模型Veo 3.1，重点升级“素材到视频”能力：在多场景叙事中提升角色/物体身份与背景一致性，使元素复用与连续故事更可控。新版本新增原生竖屏9:16输出，面向YouTube Shorts等移动内容形态；并提供更先进的1080p与4K超分辨率选项，便于后期编辑与高分发。Google表示其工具生成视频将嵌入SynthID不可感知数字水印，并在Gemini应用中提供验证能力，强化AI生成内容可识别性。

阅读原文

Google发布MedGemma 1.5+MedASR，WER最高降82%

医疗AI开源模型语音

Google Research发布MedGemma 1.5（4B）及医疗语音转文本模型MedASR。MedGemma 1.5增强对CT/MRI、病理WSI与纵向影像的解读，在疾病相关CT与MRI发现分类准确率绝对提升3%和14%，病理预测ROUGE-L提升0.47；在MedQA与EHRQA分别提升5%和22%。MedASR在胸片听写与内部听写基准上，词错误率较Whisper large-v3降低58%和82%。模型可在Hugging Face或Vertex AI获取，并启动总奖金10万美元的挑战赛。

阅读原文

阿里系PixVerse推实时AI视频工具，月活超1600万

视频生成创业公司商业化

阿里巴巴支持的PixVerse推出实时AI视频生成工具，用户可在生成过程中即时调整角色动作与剧情走向，面向互动微短剧和“无限”视频游戏等形态。公司称其平台在去年10月月活超过1600万，并计划今年上半年达到2亿注册用户、团队扩至近200人。PixVerse成立于2023年，去年秋季完成阿里领投的超6000万美元融资，当前接近完成新一轮融资；其去年10月估算年经常性收入约4000万美元。报道同时指出中国公司在视频生成速度与成本上具备优势。

阅读原文

LangSmith Agent Builder转正，提供无代码Agent搭建

AI智能体开发平台产品发布

LangChain宣布LangSmith Agent Builder正式GA，提供无代码方式构建与部署AI智能体：用户以自然语言描述目标，智能体可自行规划、执行并通过反馈迭代学习，减少手工绘制固定工作流的成本。产品支持团队共享与协作，强调可复用与可扩展；同时可通过MCP接入自定义工具，并允许接入自有LLM以优化成本/能力组合。官方给出的典型场景包括自动生成简报、市场研究，以及跨多应用的日常任务编排；智能体也可嵌入其他应用或作为子智能体复用，方便在现有系统中落地。

阅读原文

Converge Bio获2500万美元A轮，称产量提升4-7倍

AI制药融资生物科技

AI药物发现平台Converge Bio宣布完成2500万美元A轮融资，由Bessemer Venture Partners领投，多家机构及来自Meta、OpenAI、Wiz的高管跟投，公司称总融资额达到3000万美元。其平台以DNA、RNA与蛋白质序列训练的生成式模型为核心，提供抗体设计、蛋白产量优化、靶点与生物标志物发现三套系统。公司称已与十余家药企/生物科技客户完成40多个项目，并在合作中将蛋白生产产量持续提高4到7倍。资金将用于扩展平台能力与交付规模。

阅读原文

Databricks开源Dicer自动分片器，提升服务弹性

开源分布式系统AI基础设施

Databricks开源自动分片器Dicer，用于构建低延迟、可扩展且高可靠的分布式分片服务。Dicer通过控制平面动态拆分、合并与重新分配键范围（slice），依据负载和健康状态持续调整分片分布，以缓解无状态架构的数据库/缓存开销，以及静态分片在扩缩容、重启与热键下的不可用风险。系统由Assigner、Slicelet与Clerk组成，支持高性能键分配查找与本地缓存维护；官方指出其可用于远程缓存、调度控制、工作分区等多类系统场景。

阅读原文

Google Cloud推动MCP原生gRPC传输，减少转码开销

AI智能体协议标准云服务

Google Cloud发文推动为模型上下文协议MCP提供原生gRPC传输支持，作为对现有JSON-RPC传输的可插拔替代，面向已大量采用gRPC的企业Agent与工具互通场景。官方称原生gRPC可减少转码网关带来的运维复杂度，并利用Protobuf二进制编码、双向流与背压机制降低延迟和网络成本；同时借助mTLS、方法级授权等能力强化安全与可观测性。Google Cloud表示正与社区合作将该能力集成进MCP SDK，以提升互操作一致性并便于企业落地。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选，用 AI Daily Brief 开启每天的工作与生活。