GPT-5.2模型正式发布:专业知识工作显著增强,多项基准领先
OpenAI发布GPT-5.2,主打专业知识工作效率提升,推理与视觉能力大幅升级。在GDPval专业评测中,GPT-5.2击败或持平行业专家的比例达到70.9%;ARC-AGI-2推理得分52.9%;SWE-Bench Pro编程成绩达55.6%。该模型在长上下文理解、多模态感知、代码生成等方面显著进步,适配企业知识密集型任务,并已在ChatGPT和API全量上线。
阅读原文OpenAI发布GPT-5.2,主打专业知识工作效率提升,推理与视觉能力大幅升级。在GDPval专业评测中,GPT-5.2击败或持平行业专家的比例达到70.9%;ARC-AGI-2推理得分52.9%;SWE-Bench Pro编程成绩达55.6%。该模型在长上下文理解、多模态感知、代码生成等方面显著进步,适配企业知识密集型任务,并已在ChatGPT和API全量上线。
阅读原文OpenAI与迪士尼达成10亿美元投资及三年授权合作,允许OpenAI旗下Sora和ChatGPT生成200余位迪士尼、漫威、皮克斯、星球大战等品牌角色的图片和视频内容。合作规定OpenAI须建安全防护,防止侵权输出和不当内容;迪士尼成为OpenAI主要股东及客户,将部署ChatGPT于内部创新。此举标志AI公司与IP巨头建立新型内容分发与版权协作模式。
阅读原文微软、谷歌、OpenAI和Anthropic等将联合Linux基金会成立Agentic AI基金会(AAIF),致力于推动AI Agent系统的开源标准制定与工具共享。核心工作包括标准化模型上下文协议(MCP)、Agent任务指令(Agents.md)、本地运行开源Agent(Goose)等关键技术,目标推动各家Agent应用和安全一体发展,加强行业生态协同与基础能力开放。
阅读原文在主要基准测试(如ARC-AGI-2、SWE-Bench Pro、GDPval)中,GPT-5.2在知识推理、代码生成、长文档理解等领域均居行业首位,高于Gemini 3、Claude Opus 4.5等竞争对手。Notion、Box、Shopify、Harvey、Zoom等早期用户反馈5.2在长链路自动化、工具调用、Agent工作流与文档分析场景中实际表现达SOTA水平。
阅读原文随着AI应用对大模型、多模态理解和Agent能力的需求提升,全球头部科技公司正加速算力投入和生态联盟建设。例如OpenAI计划未来数年投入数千亿美元提升算力规模,AWS、谷歌等也在本地AI算力和跨平台底层标准方面联合布局,共同推动AI工厂、专有数据中心、本地大模型部署和Agent通用协议标准化,保障AI“端-云-本地”全场景落地与商业化能力。
阅读原文2025年第一季度,全球AI领域风险投资总额达596亿美元,占所有全球投融资的53%,显著反映出人工智能技术在各领域渗透速度加快。技术龙头、初创企业与应用场景公司均获巨额投资,AI人才招聘、算法平台、Agent产品初创表现活跃,推动AI创新加速与全球市场规模扩张。
阅读原文数据表明,在AI内容快速生成及分发背景下,全球监管进一步趋严。中国、美国等推动AI生成内容标记、水印机制,并通过与内容方(如迪士尼)合作授权,探索推进大规模IP应用与防止侵权并行路径。平台和工具方(如GPT、Sora类生成器)被要求针对未成年人、敏感语境等场景实施分级与内容管控,AI内容治理标准和跨国合规体系正逐步成型。
阅读原文2025年《时代》杂志评选AI架构师为年度人物,NVIDIA CEO黄仁勋、OpenAI CEO奥特曼、Anthropic CEO阿莫代伊、谷歌DeepMind创始人哈萨比斯等AI产业核心企业领袖与代表,同时登上封面。该选择反映了AI对全球经济、社会结构、内容产业等广泛影响力和当前科技话语权高度集中。
阅读原文英伟达投资的Starcloud宣布在搭载H100 GPU的太空卫星上完成首个大语言模型离线训练。此举代表AI基础设施正走向节能、分布式,“太空算力”的部署或将拓展军用、实时数据分析、高密度数据收集等新应用场景,加速AI应用多元化与能源效率提升。
阅读原文著名投资人Steve Eisman警告,随着大模型不断扩展,其性能提升空间或将逐步收窄,“规模化=更好AI”的假设面临挑战。若趋势成立,将影响算力投资节奏、硬件供需及AI股市估值,督促产业关注AI实际应用场景、商业化路径与ROI;AI芯片与边缘计算领域或面临战略调整。
阅读原文数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。