谷歌发布Gemini 3.1 Pro:ARC-AGI-2达77.1%
谷歌发布Gemini 3.1 Pro预览版,面向复杂推理与代理工具使用。ARC-AGI-2为77.1%,GPQA Diamond 94.3%,SWE-Bench Verified 80.6%。资料称其支持最高100万token输入、65k输出,并提供customtools预览端点。模型已通过Gemini API、AI Studio与Vertex AI开放,并在GitHub Copilot进入公开预览;定价按百万token计:200K内输入$2/输出$12,超200K输入$4/输出$18。
阅读原文