详情

首页手游攻略 谷歌正式对Meta推行Gemini大模型的算力额度使用限制

谷歌正式对Meta推行Gemini大模型的算力额度使用限制

佚名 2026-07-01 08:32:51

近日,谷歌正式对Meta实施Gemini大模型的算力额度使用限制,这一举措直接打乱了Meta内部多个人工智能项目的推进节奏,也让整个行业清晰看到,即便手握全球顶尖算力基础设施的科技巨头,也依然难以跟上市场对AI算力的爆发式增长需求,算力供给不足已经成为当前人工智能产业向更高阶发展的核心瓶颈。

谷歌正式对Meta实施Gemini大模型的算力额度使用限制

这次算力限制事件的核心导火索,是Meta的算力需求规模远超谷歌的预期承载上限。早在2026年3月,Meta就向谷歌提交了Gemini大模型的算力使用申请,其申请的算力规模远超谷歌当时能够调配的最大供给额度,谷歌在第一时间就向Meta告知了无法足额供应的现实情况。但随着2026年第二季度全球AI应用的全面爆发,Gemini API的市场请求量在3月至8月的短短5个月内直接翻倍,谷歌云部门的积压订单量环比近乎翻番,全行业的开发者与企业客户都在争抢有限的AI算力资源,在整体算力池被挤兑的背景下,需求规模格外庞大的Meta自然成为受冲击最严重的客户。

为了应对算力供不应求的局面,谷歌从5月17日开始正式对所有Gemini应用客户实施基于算力额度的使用限制,这套规则类似于大众熟知的手机流量套餐:所有客户的算力使用都被纳入每周滚动更新的5小时刷新窗口内,同时设置了明确的每周算力使用上限,一旦超出额度就会被临时限制调用。除了Meta之外,其他谷歌云的企业客户也不同程度受到了算力供给紧张的影响,但由于Meta的AI研发项目对Gemini算力的依赖度极高、需求规模远超普通客户,受到的冲击也最为显著。

突如其来的算力供给缺口,直接打乱了Meta的AI研发节奏。多个原本按计划推进的内部人工智能项目,因为无法获取足够的Gemini算力支撑,相关研发工作被迫推迟。为了在有限的算力额度内保障核心项目推进,Meta内部已经正式向全体员工提出要求,必须节约使用AI词元(token),通过优化调用逻辑、精简无效请求等方式提升每一份算力的使用效率,尽可能在有限配额内支撑更多研发工作的开展。

这一事件绝非两家科技巨头之间的孤立商业事件,而是整个全球AI产业发展阶段的一个缩影。近年来,全球各大科技企业持续投入数十亿美元采购高端AI芯片、建设超大规模数据中心,试图跟上AI产业的算力增长需求,但市场对AI服务的需求增速,依然远超算力基础设施的建设速度。即便谷歌这样持续加码AI基础设施投入的行业巨头,也依然无法确保有足够的算力应对市场的激增需求,算力供给的缺口已经成为制约人工智能产业进一步规模化落地的核心瓶颈。

从更深层的行业视角来看,这次事件也为整个AI产业敲响了警钟:在大模型与智能体技术快速迭代的当下,算力不再是可以无限供给的底层资源,而是决定企业研发节奏、业务落地速度的核心战略资源。未来很长一段时间内,算力的供需调配能力,都将成为所有AI企业核心竞争力的重要组成部分,整个行业也将在算力供给的倒逼下,进一步探索更高效的算力调度、更精简的模型推理技术,推动AI产业在有限算力资源下实现更高质量的发展。

点击查看更多
推荐专题
热门阅读