快訊 > 快訊詳情
2026-02-13 16:27:04
【谷歌發佈Gemini3 DeepThink重大升級 多項基準測試創紀錄】
⑴ 2月13日,谷歌發佈了Gemini3 DeepThink的重大升級,該模型作為專門用於複雜任務的推理模式,旨在解決科學、工程領域的諸多挑戰。
⑵ 在多項基準測試中,DeepThink創下新紀錄,超越了Claude Opus 4.6和GPT-5.2。
⑶ 模型在“人類最後的考試”測試中取得了48.4%的成績。
⑷ 在ARC-AGI-2測試中取得了84.6%的成績,相當於在全球編程能力上能排進前8。
⑸ 此外,DeepThink在化學和物理等科學領域表現出色。
⑹ 該模型在2025年國際物理和化學奧林匹克競賽的筆試部分取得了金牌級別的成績
⑴ 2月13日,谷歌發佈了Gemini3 DeepThink的重大升級,該模型作為專門用於複雜任務的推理模式,旨在解決科學、工程領域的諸多挑戰。
⑵ 在多項基準測試中,DeepThink創下新紀錄,超越了Claude Opus 4.6和GPT-5.2。
⑶ 模型在“人類最後的考試”測試中取得了48.4%的成績。
⑷ 在ARC-AGI-2測試中取得了84.6%的成績,相當於在全球編程能力上能排進前8。
⑸ 此外,DeepThink在化學和物理等科學領域表現出色。
⑹ 該模型在2025年國際物理和化學奧林匹克競賽的筆試部分取得了金牌級別的成績