美团开源LongCat-Flash-Thinking-2601,支持8路并行重思考
美团宣布开源并开放体验推理模型LongCat-Flash-Thinking-2601,主打“重思考”决策:先并行探索8条推理路径,再总结归纳生成行动计划。团队引入强化学习与噪声环境训练,强化智能体搜索、工具调用与交互推理的泛化能力,称可降低新工具接入与适配成本。模型权重与推理代码同步开放,面向开发者试用与自托管部署。
阅读原文美团宣布开源并开放体验推理模型LongCat-Flash-Thinking-2601,主打“重思考”决策:先并行探索8条推理路径,再总结归纳生成行动计划。团队引入强化学习与噪声环境训练,强化智能体搜索、工具调用与交互推理的泛化能力,称可降低新工具接入与适配成本。模型权重与推理代码同步开放,面向开发者试用与自托管部署。
阅读原文OpenAI表示将在未来数周内对美国部分用户在ChatGPT免费版与月付8美元的Go版本试点展示广告,这是其首次引入广告变现。公司称广告与模型回答分离且明确标识,不会影响回答内容;与ChatGPT的对话不会向广告商共享。Pro及企业/机构版、以及18岁以下用户不展示广告。此举被视为在高运营成本下扩展可及性与收入结构的调整。
阅读原文ClickHouse宣布收购开源LLM可观测性平台Langfuse,后者提供提示词管理、评估与实验、跟踪与质量监控等能力,架构基于ClickHouse高写入与分析性能。官方称Langfuse已被19家财富50强与63家财富500强采用,月度SDK安装量超2310万、Docker拉取超600万次。收购后项目继续MIT协议并支持自托管,云服务保持独立运营,双方将加强“代理数据栈”集成。
阅读原文Replit宣布获得4亿美元融资、估值达90亿美元,由Georgian领投,用于加速其AI编程与“vibe coding”战略。公司称拥有超过15万名付费客户,2025年收入为2.4亿美元,并推出移动端“Mobile Apps on Replit”,允许用户用自然语言生成应用、快速上线并接入Stripe变现。融资反映AI编码工具竞争升温,Replit正与Cursor等产品争夺开发与非技术用户。
阅读原文维基媒体基金会与亚马逊、Meta、微软、Perplexity、Mistral AI等签署内容授权协议,将维基百科约6500万篇条目纳入付费使用框架,意在缓解AI爬虫对服务器资源的压力并补充基础设施资金。材料称,聊天机器人分流使维基百科的人类访问量下降约8%。基金会同时探索用AI处理死链更新等编辑工作。部分社区编辑担忧付费授权可能影响开放性与可信度。
路透社援引消息称,美国联邦贸易委员会(FTC)正加强审查大型科技公司的“人才收购”(acqui-hire)做法,即通过雇佣初创公司核心团队而非直接并购,来获取技术与人才并可能规避反垄断审查。该动向可能影响AI领域频繁出现的团队并入与产品关闭模式,增加交易结构与信息披露要求的不确定性,并迫使大厂在招募、合作与并购之间重新权衡合规风险。
阅读原文欧洲药品管理局(EMA)与美国FDA共同制定医药研发中使用人工智能的通用原则,意在推动两大监管体系在AI方法、数据治理与风险控制上的协同。摘要称该原则将用于指导药物开发各环节的AI应用,强调安全、有效与符合伦理的治理要求,减少跨境研发在合规口径上的分裂。对药企与AI药研公司而言,这意味着监管期望更趋一致,但也可能带来更明确的验证与文档要求。
阅读原文中央网信办网站更新发布多项备案信息,包括第二十一批境内区块链信息服务备案编号、2025年已备案的生成式人工智能服务信息,以及第十五批深度合成服务算法备案信息,并同步推进“清朗”专项整治与相关法规征求意见。对提供大模型与AIGC服务的企业而言,备案与信息披露将继续作为上线与运营的基础合规门槛,且与内容治理、个人信息保护等要求联动加强,影响产品迭代与商业化节奏。
阅读原文arXiv论文提出ReasAlign方法,用结构化推理分析用户请求与潜在冲突指令,以降低智能体系统中的间接提示注入风险。方法在测试时结合偏好优化的判别模型对多条推理轨迹打分并选优,实现“测试时扩展”。论文报告在保留94.6%效用的同时,将攻击成功率(ASR)降至3.6%,显著优于对比方法。作者公开了代码与实验结果,面向代理式工具调用场景。
阅读原文数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。