返回往期
2026年1月15日星期四
9 点要闻3 分钟阅读

今日要闻

1

爱诗科技发布PixVerse R1,全球首个实时交互AI视频世界模型

AI视频世界模型

爱诗科技推出PixVerse R1,标志着全球首个支持最高1080P分辨率、可实时生成和交互的AI视频世界模型。该产品通过Omni原生多模态基础模型、自回归流式生成机制和瞬时响应引擎,实现了用户指令下的即时画面响应,消除了传统AI视频生成的等待过程。PixVerse R1将视频从静态结果转变为可持续演化、可实时干预的动态视觉流,开创了“Playable Reality”(可玩现实)新范式。该模型有望重塑数字娱乐、互动电影、生成式直播电商等内容形态。当前产品处于内测阶段,尚未全面开放。

阅读原文
2

智谱与华为联合开源GLM-Image,国产芯片全流程训练多模态SOTA模型

多模态模型国产芯片开源

智谱AI与华为联合发布并开源了多模态图像生成模型GLM-Image,这是首个在国产昇腾NPU和MindSpore AI框架上全流程训练的SOTA多模态模型。GLM-Image采用自回归与扩散解码器混合架构,具备高保真图像生成能力,尤其在中文文字渲染和复杂信息表达方面表现突出。模型在CVTG-2K和LongText-Bench等权威榜单上取得开源第一,支持多分辨率自适应和多种图文任务。为应对高内存和性能需求,昇腾+昇思提供了动态图多级流水、高性能融合算子等优化,全面支持端到端高效训练。模型已在Hugging Face、ModelScope等平台开源,API调用价格低廉。

阅读原文
3

谷歌发布MedGemma 1.5和MedASR,开源医疗AI模型支持本地部署

医疗AI开源

谷歌于2026年1月14日发布了新一代医疗AI模型MedGemma 1.5 4B和医疗专用语音识别模型MedASR。MedGemma 1.5是一款可本地部署的轻量级多模态模型,能处理文本及CT、MRI等三维医学影像数据,准确率优于前代产品和通用模型,部分测试超越更大参数模型。该模型支持开发者微调,已衍生出500余款优化模型。MedASR在胸部X光相关对话中的转录错误率仅5.2%,显著优于OpenAI Whisper large-v3。两款模型均已免费开源,通过Hugging Face、Vertex AI和GitHub等平台提供,推动医疗AI社区开放创新。

阅读原文
4

Anthropic推出Claude Cowork,AI可本地操作文件并暴露安全漏洞

AI代理安全

Anthropic发布Claude Cowork功能,允许AI在macOS平台访问本地文件夹,执行文件读取、编辑和创建等操作,实现自动化办公。该功能以研究预览形式向Claude Max用户开放,强调本地优先和用户隐私,用户需审批高影响操作。Cowork降低了AI自动化门槛,使非技术用户也能通过自然语言指令实现复杂任务自动化,推动AI从“对话助手”向“行动代理”演进。然而,安全研究发现Cowork存在提示注入漏洞,攻击者可利用Anthropic API白名单绕过限制,将用户文件上传至Anthropic服务器,存在数据泄露风险。

阅读原文
5

OpenAI与Cerebras达成超100亿美元AI芯片算力协议

AI芯片基础设施

OpenAI宣布与AI芯片制造商Cerebras Systems达成一项价值超过100亿美元的协议,计划到2028年为OpenAI提供高达750兆瓦的算力。该合作旨在增强OpenAI在AI模型训练和推理方面的基础设施能力,减少对单一供应商的依赖。Cerebras将为OpenAI提供定制化算力解决方案,并确保其开源模型gpt-oss能在Cerebras芯片上顺利运行。此次交易有助于Cerebras分散收入来源,并为其即将重新提交的IPO提供业绩支撑。该协议凸显了AI基础设施市场对高性能算力的持续需求。

阅读原文
6

美国放宽H200等AI芯片对华出口但附加严格条件

芯片出口政策

美国商务部修改出口管制条例,放宽英伟达H200等高性能AI芯片对中国出口,但附加多项严格条件,包括需保证美国市场供应、对华出口量不得超过美国市场总量50%、禁止军事用途及需第三方测试。此次调整为英伟达等企业在中国市场销售H200等芯片提供法律依据,预计将带来巨额营收和许可分成。与此同时,美国国会通过新法案限制通过云服务远程获取先进算力,显示美方在半导体政策上采取软硬兼施策略。

阅读原文
7

OpenAI和Anthropic启动IPO准备,2026年或迎AI企业上市潮

IPOAI企业

据多家媒体报道,OpenAI和Anthropic已采取初步行动,为2026年下半年可能的首次公开募股(IPO)做准备。OpenAI预计2026年年化收入将达200亿美元,私有市场估值已达5000亿美元,目标IPO估值或达1万亿美元,但因大规模基础设施投入,预计2029年累计亏损将达1150亿美元。Anthropic也在积极筹备上市。市场普遍预期2026年将成为科技公司IPO的超级周期,反映出资本市场对AI企业前景的高度关注。

阅读原文
8

Meta宣布数百吉瓦级AI基础设施计划,战略重心转向AI

AI基础设施Meta

Meta宣布启动Meta Compute战略,计划在本十年内建设数十吉瓦、长期达数百吉瓦的AI基础设施容量,预计到2028年将在美国投入6000亿美元,并已签署20年期核能供电协议。该计划由基础设施主管Santosh Janardhan与前SSI负责人Daniel Gross共同领导,旨在确保Meta在AI竞赛中的领先地位。此举紧随Meta对Reality Labs和元宇宙部门约10%的大规模裁员,标志着公司战略重心从VR向AI全面转移。

9

ElevenLabs年经常性收入突破3.3亿美元,语音AI商业化加速

语音AI商业化

ElevenLabs的年经常性收入(ARR)已超过3.3亿美元,显示其在AI语音生成领域的快速增长。公司成立于2022年,20个月内ARR达1亿美元,随后10个月翻倍至2亿美元,再5个月增至3.3亿美元。其语音AI技术被财富500强企业和初创公司广泛采用,每月处理企业环境中超5万通电话。2025年1月,ElevenLabs完成1.8亿美元C轮融资,估值达33亿美元。公司已扩展至音乐创作领域,并获得多位名人声音授权。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。