百川智能开源Baichuan-M3,2350亿参数医疗模型
百川智能于1月13日发布医疗场景大模型Baichuan-M3,披露参数规模2350亿,重点优化医疗幻觉控制与端到端问诊推理。公司称其在HealthBench/HealthBench Hard、医疗幻觉等评测中排名第一,并在自建问诊评测中超过人类医生表现。模型融合医学文献、临床指南、真实病历及药品知识库,支持疾病推理、用药建议与检验解读等能力;目前已开源并在“百小应”平台开放体验,面向辅助诊断与健康管理落地。
阅读原文百川智能于1月13日发布医疗场景大模型Baichuan-M3,披露参数规模2350亿,重点优化医疗幻觉控制与端到端问诊推理。公司称其在HealthBench/HealthBench Hard、医疗幻觉等评测中排名第一,并在自建问诊评测中超过人类医生表现。模型融合医学文献、临床指南、真实病历及药品知识库,支持疾病推理、用药建议与检验解读等能力;目前已开源并在“百小应”平台开放体验,面向辅助诊断与健康管理落地。
阅读原文DeepSeek创始人梁文锋与北大等发表论文提出Engram“条件记忆”模块,将静态知识的存储与计算解耦,通过可检索记忆表缓解GPU高带宽内存(HBM)容量限制,并提升长上下文处理效率。团队在一款270亿参数模型上验证,多个行业基准表现提升“几个百分点”。论文还给出经验配比:约75%资源用于推理计算、约25%用于记忆可取得更优效果,并认为条件记忆可能成为下一代稀疏模型的重要建模原语,服务成本效率导向的Scaling路径。
阅读原文Google DeepMind更新视频生成模型Veo 3.1,重点升级“素材到视频”能力:在多场景叙事中提升角色/物体身份与背景一致性,使元素复用与连续故事更可控。新版本新增原生竖屏9:16输出,面向YouTube Shorts等移动内容形态;并提供更先进的1080p与4K超分辨率选项,便于后期编辑与高分发。Google表示其工具生成视频将嵌入SynthID不可感知数字水印,并在Gemini应用中提供验证能力,强化AI生成内容可识别性。
阅读原文Google Research发布MedGemma 1.5(4B)及医疗语音转文本模型MedASR。MedGemma 1.5增强对CT/MRI、病理WSI与纵向影像的解读,在疾病相关CT与MRI发现分类准确率绝对提升3%和14%,病理预测ROUGE-L提升0.47;在MedQA与EHRQA分别提升5%和22%。MedASR在胸片听写与内部听写基准上,词错误率较Whisper large-v3降低58%和82%。模型可在Hugging Face或Vertex AI获取,并启动总奖金10万美元的挑战赛。
阅读原文阿里巴巴支持的PixVerse推出实时AI视频生成工具,用户可在生成过程中即时调整角色动作与剧情走向,面向互动微短剧和“无限”视频游戏等形态。公司称其平台在去年10月月活超过1600万,并计划今年上半年达到2亿注册用户、团队扩至近200人。PixVerse成立于2023年,去年秋季完成阿里领投的超6000万美元融资,当前接近完成新一轮融资;其去年10月估算年经常性收入约4000万美元。报道同时指出中国公司在视频生成速度与成本上具备优势。
阅读原文LangChain宣布LangSmith Agent Builder正式GA,提供无代码方式构建与部署AI智能体:用户以自然语言描述目标,智能体可自行规划、执行并通过反馈迭代学习,减少手工绘制固定工作流的成本。产品支持团队共享与协作,强调可复用与可扩展;同时可通过MCP接入自定义工具,并允许接入自有LLM以优化成本/能力组合。官方给出的典型场景包括自动生成简报、市场研究,以及跨多应用的日常任务编排;智能体也可嵌入其他应用或作为子智能体复用,方便在现有系统中落地。
阅读原文AI药物发现平台Converge Bio宣布完成2500万美元A轮融资,由Bessemer Venture Partners领投,多家机构及来自Meta、OpenAI、Wiz的高管跟投,公司称总融资额达到3000万美元。其平台以DNA、RNA与蛋白质序列训练的生成式模型为核心,提供抗体设计、蛋白产量优化、靶点与生物标志物发现三套系统。公司称已与十余家药企/生物科技客户完成40多个项目,并在合作中将蛋白生产产量持续提高4到7倍。资金将用于扩展平台能力与交付规模。
阅读原文Databricks开源自动分片器Dicer,用于构建低延迟、可扩展且高可靠的分布式分片服务。Dicer通过控制平面动态拆分、合并与重新分配键范围(slice),依据负载和健康状态持续调整分片分布,以缓解无状态架构的数据库/缓存开销,以及静态分片在扩缩容、重启与热键下的不可用风险。系统由Assigner、Slicelet与Clerk组成,支持高性能键分配查找与本地缓存维护;官方指出其可用于远程缓存、调度控制、工作分区等多类系统场景。
阅读原文Google Cloud发文推动为模型上下文协议MCP提供原生gRPC传输支持,作为对现有JSON-RPC传输的可插拔替代,面向已大量采用gRPC的企业Agent与工具互通场景。官方称原生gRPC可减少转码网关带来的运维复杂度,并利用Protobuf二进制编码、双向流与背压机制降低延迟和网络成本;同时借助mTLS、方法级授权等能力强化安全与可观测性。Google Cloud表示正与社区合作将该能力集成进MCP SDK,以提升互操作一致性并便于企业落地。
阅读原文数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。