谷歌表示,Gemini 3具备博士级别(PhD-level)的推理能力,在多项测试中表现优异。谷歌还着重强调了Gemini 3可以帮助用户“学习一切、创作一切、规划一切”(Learn anything、Build anything、Plan anything)。
具体来看,Gemini 3进一步突破了多模态推理的边界,具备领先的推理能力、视觉与空间理解能力,以及卓越的多语言表现力,并支持高达100万token的超长上下文窗口,助力用户高效学习。
譬如,谷歌展示了Gemini 3如何帮助用户学习烹饪技艺。在演示中,Gemini 3精准解读并翻译了不同语言的手写食谱,并最终汇集成一本便于分享的食谱集。此外,Gemini 3还能够分析比赛视频,指出薄弱环节,并制定训练计划。
在创作方面,谷歌着重强调了Gemini 3的编程能力,其在WebDev Arena、Terminal-Bench 2.0、SWE-bench Verified等衡量工具使用及编程能力的基准测试中均取得高分。
谷歌亦推出了Antigravity智能体平台,将AI辅助从开发者工具包中的一种工具,升级为全程参与的主动协作者。使智能体实现自主规划并同时执行复杂的端到端软件任务,全程代劳完成代码验证。
在长期规划的可靠性方面,Gemini 3在Vending-Bench 2榜单中居榜首。据悉,该测试通过管理模拟的自动售货机业务,检验模型的长周期规划能力,而Gemini 3 Pro在长达一年的完整模拟运营中,持续保持工具使用与决策的一致性,确保收益稳步提升,同时始终专注任务目标。
谷歌称,Gemini 3能够应对复杂多步骤工作流,更好地完成日常生活中的各项任务,如预订本地服务或整理收件箱等。
本网通过AI自动登载内容,本文转载自MSN,【提供者:什么值得买 | 作者:什么值得买】,仅代表原作者个人观点。本站旨在传播优质文章,无商业用途。如不想在本站展示可联系删除。

