B体育(BSports) Google I/O深度见识: 给Agent 期间寻找最经济的解


整场I/O 2026,谷歌CEO Pichai说了句不太像他会说的话:"最前沿的Agent可能只触达过天下上0.1%的东说念主。"
话外音没说,但兴味很明晰:Agent这东西还是跑通了,可跑通和跑起来是两件事。
OpenAI有Operator、Codex,Anthropic有Claude Code、Cowork,但它们于今只在少量数东说念主的责任流里转。Google想作念的,是让Agent酿成「自来水」。
这八成是透露整场I/O 2026最重要的一把钥匙。
Gemini 3.5、Spark、Omni、搜索变革、TPU 8,看上去是五件事,但底层只讲了一件事:Agent怎么从0.1%走到99.9%?

1
Gemini 3.5 Flash是总共其他事情的底座。
Agent的经济模子能弗成成立,取决于单次任务的本钱够不够低。3.5 Flash作念的事情,是把Agent的运行本钱拉到一个不错领域化的水位。
Google我方也还是这样干了——里面token日处理量从3月的5000亿飙到3万亿,每隔几周翻一倍。
基准测试一句话带过:Terminal-Bench 76.2%、MCP Atlas 83.6%、GDPval 1656 Elo,全面压了自家四个月前的3.1 Pro一头——又一个中杯干翻大杯的故事,和GPT-4o mini跳跃GPT-4、Sonnet贴近Opus是归拢条弧线——参数壁垒正在被工程截止摊薄。
但Pichai把3.5 Flash推到舞台中心,不是在秀肌肉,是在算账。
3.5 Flash输出速率是其他前沿模子的4倍,在Antigravity框架内优化后可达12倍,订价不到同档前沿模子的一半。
他在台上径直报了数:一家每天在Google Cloud上处理1万亿token的企业,把80%的负载迁到Flash,一年能省跳跃10亿好意思元。Pichai还补了一句:"你可能听过CIO牢骚年度token预算到五月就花光了。"
Pro下个月才上,但Flash还是够用了。

2
引擎有了,接下来是车。
Gemini Spark,Google的第一个个东说念主Agent居品,24/7跑在云霄诬捏机上,你合上电脑它还在干活。
底层是Gemini 3.5 Flash加Antigravity框架,解救长周期任务。
演示场景很能评释问题:让它写一封居品回想邮件,它自动从Gmail、Docs、Sheets、Slides里拉事实写草稿;让它管学校时候表,它横跨日期、邮件、通信录来相接。
这些事远离看齐不复杂,但串起来需要一样东西:对用户数字活命的全盘拜访权。这便是Google作念Agent的护城河——和OpenAI、Anthropic不在一个维度上。
后两者的Agent更强、更活泼、编码才调更硬,但它们够不到你的邮箱、日期、文档和通信录。
Spark不错,因为它就长在这些东西里。
某种兴味上,这是Google二十年来聚积的最大一笔金钱第一次被激活。Gmail、Calendar、Docs、Sheets、Drive——这些居品各自齐出奇亿用户,但一直是孤岛。Spark第一次用一个Agent把它们连成了群岛。
这和智妙手机早期的一个时刻是同构的。iPhone之前,手机上的App亦然孤岛——你在通信录里找到号码,手动切到短信App发送。iOS把通信录、短信、电话、日期买通,一个相干东说念主卡片上就能径直发短信、打电话、荟萃议。
这种"买通"自己不是本领冒昧,但它更动了用户的活动时势。Spark便是Google版的那次"买通",AG真人中国官方网站仅仅从手机推广到了通盘数字活命。
3
Gemini 3.5 Flash是Agent的引擎,Spark是Agent的车,而第一次亮相的Omni则走了另一条路——它不跑Agent,它跑"天下模子"。
Gemini Omni 目下还唯独 flash 版块,还是上线Google FLow,它的定位是"能从任何输入生成任何输出模态的模子",从目下的演示看,你不错凡俗的透露为「P视频」。
文本、图像、音频、视频,纵情组合输入,跨模态推理后输出视频。不是活水线拼接,是一个推理经过把总共输入吃透,生成一个逻辑自洽的截止。
Omni不是Veo的老例升级,它是Gemini主架构从输入端多模态延长到输出端多模态的产物——Veo和Nano Banana酿成了它身上的才调组件,而不是寂寥模子。
Omni其实又是一个"专用模子走向息争模子"的案例——GPT-4启动把文本和图像塞进一个模子,Gemini 1.0接入了音频,但生成侧仍然割裂。
而Omni把生成侧也完成息争——就像早年的声卡、显卡、网卡从寂寥板卡整合进CPU,不是因为专用有规画不够好,而是因为息争有规画排斥了模态间的调度本钱,B体育(BSports)而这种本钱是多模态责任流里最大的摩擦。
4
模子变了,搜索也得变。
Agentic Coding参预搜索:搜"黑洞怎么影响时空",搜索引擎不再复返贯穿,而是及时写代码、跑代码,给你一个不错拖拽参数的交互式可视化页面。搜索第一次从"找信息"酿成了"作念事情"。
这代网民八成不会铭刻,1998年Google上线时作念的事儿叫"组织寰球信息"——你发问,它给地址。
28年已往,常识图谱让它更精确,AI Overview让它更径直,但底层逻辑永远没变过:我帮你找到,你我方看。
而目下,这个逻辑被撕开了一齐口子,搜索径直在原地搭建一个谜底。从信息检索到问题惩处,一个典型的范式搬动。
Google敢对所灵验户免费绽开,因为它需要用户养成"搜索即惩处问题"的习尚——一朝成立,搜索引擎就从流量进口酿成了任务奉行进口。
5
底层逻辑变了,底层硬件也得随着变。
TPU 8拆成了两颗芯片:TPU 8t专攻查验,TPU 8i专攻推理。算力翻倍在AI行业还是不算新闻了,信得过挑升念念的是查验和推理第一次被当成了两种截然有异的责任负载。
早年的贪图机唯唯独颗通用处理器,自后GPU寂寥出来,CPU和GPU的分家是因为贪图需求的分化倒逼了硬件的分化。
TPU 8t和8i的分家慑服不异的机制——查验是批量重贪图,推理是低延迟轻贪图,强行用一颗芯片兼顾两者,就像让一辆车同期跑拉力赛和F1。远离之后,各自奔向各自的最优解。
这是基础递次走向纯属的记号。
一个行业还在草野阶段时,通用有规画就够了;唯独当需求分化到一定进度,专用有规画才比通用有规画更经济。查验和推理的分家,意味着AI贪图的需求还是复杂到值得在硅片层面作念选用了。
6
回看整场I/O 2026,Pichai那句话其实还是把底牌亮了。
Gemini 3.5 Flash把Agent的运行本钱拉到可领域化的水位,Spark把Google二十年的居品矩阵第一次用一个Agent串了起来,Omni把多模态生成从分治推向息争,搜索从信息检索酿成了任务奉行,TPU 8把查验和推理拆成了两条专用赛说念。
固然,还有Antigravity 2.0 重构,隐形水印通用门径SynthID,AI Studio更新,AI智能眼镜等等等等。
这几件事看上去各管各的,但横着排开,Google在作念归拢件事:给Agent期间的每一个层级找一个最经济的解。
DeepMind 掌门东说念主哈萨比斯在已毕时说:"当咱们回望这一刻,我想咱们会融会到,咱们正站在奇点的山眼下。这将是东说念主类一个兴味潜入的时刻。"
这话听起来像修辞,但如若你把I/O 2026的发布横着排开看——模子、居品、生成、进口、硬件——Google如着实搭建某种无缺的东西——一个尚未到来的期间作念脚手架。
ag真人app官方网站入口不外,脚手架和建筑毕竟是两回事。
Google在I/O上展示的总共才调——Spark的长程任务、Omni的跨模态生成、搜索的Agentic Coding——齐是受控演示。当这些才调被数亿用户信得过使用时,会发生什么?
Spark会不会在你不小心的时候把一封不该发的邮件发出去了?Omni生成的视频会不会在某个你不介意的细节上出现事实性谬妄?Agentic Search跑出来的代码,谁来考证?
本领从0.1%到99.9%的路上,最大的欺压从来不是才调不够,是出错之后怎么办。
Google此次专门花了时候讲Spark的安全联想——念念考轨迹及时展示、敏锐操作前征求许可——但这仅仅第一个版块。
信得过的锻练是,当Agent的权限大到不错替你发邮件、订会议、写代码的时候,一次误操作的代价也大到用户承受不起。
0.1%的东说念主能容忍Agent犯错,99.9%的东说念主弗成。从前者到后者的距离,可比从0到0.1%远得多。
对了,可能还有些你早还是在各大媒体上说起的数据,我认为这些不是要点,却是 Google 感勇于作念上头这些事的最大底气。
Gemini App月活用户一年翻倍至9亿+B体育(BSports),谷歌搜索的AI概览功能用户冒昧25亿、AI时势用户超10亿。