Google发布Gemini 3,LMArena 1501并上线Deep Think
Google发布Gemini 3并强调“深度推理”。报道称Gemini 3 Pro在LMArena以1501 Elo居首;GPQA Diamond准确率91.9%,Humanity’s Last Exam为37.5%,启用Deep Think后提升至41%。Deep Think已向每月250美元AI Ultra订阅用户开放,并在ARC-AGI-2得分45.1,后续数周内扩大上线;能力已整合至Search AI Mode、Gemini App、AI Studio/Vertex AI与CLI。
阅读原文