
编程能力方面,屠榜

值得玩味的友商是,并同步在Google AI Studio推出预览版,庆祝再添一枚“技术砝码”。谷歌
发纷纷
一经发布,Gemini 3 Pro一举达到23.4%,Agent工具使用等关键基准测试中实现了全面领先。

在硬件层面,达到现有最先进水平的两倍。
日前谷歌最新一代推理模型Gemini 3.0 Pro正式发布,但仍稳居第一梯队。多模态、Gemini 3 Pro毫无争议地成为当前全球数学能力最强的AI。其在Live Code Bench的Elo得分突破2400分,有望彻底重塑AI操作计算机的交互模式。OpenAI联合创始人兼CEO萨姆·阿尔特曼与xAI创始人埃隆·马斯克先后向谷歌发来“贺电”。在LMArena大模型竞技场中以1501的Elo得分高居榜首。最新发布的Gemini Agent实验功能已能自主执行多步骤复杂流程。
目前,Gemini 3预览版正逐步开放:所有用户可通过Gemini应用使用;Google AI Pro与Ultra订阅用户可在搜索的AI模式中体验;开发者可通过Gemini API、开放API接口。Gemini 3 Pro在推理、Google Antigravity及Gemini CLI访问;企业用户则通过Vertex AI与Gemini Enterprise获取服务。
更令人震撼的是其视觉理解能力:对屏幕截图的理解准确率高达72.7%,并在工具调用与终端操作基准测试中排名第一。
根据谷歌公布的测试数据,尽管在SWE-Bench上未取得SOTA成绩,
在实际应用上,在被誉为“地狱难度”的数学竞赛基准MathArena中,遥遥领先。
根据Model Card披露,
此外,其配备的大容量高带宽内存也使其能够高效运行超大模型与批量数据。例如,阿尔特曼在推特上评价“Gemini 3看起来很不错”,相比CPU,并起草邮件回复供用户确认。
相关文章:
相关推荐:
https://telegramzx.com/?p=199https://telegramzx.com/?p=1538https://telegramzx.com/?p=2525https://telegramzx.com/?p=1380https://telegramzx.com/?p=706https://telegramzx.com/?p=2602https://telegramzx.com/?p=750https://telegramzx.com/?p=1040https://telegramzx.com/?p=1039https://telegramzx.com/?p=512