Alibaba Group Holding Limited fechou em $167,05, marcando um aumento de 1,19%, após um grande avanço na infraestrutura de IA.
Alibaba Group Holding Limited, BABA
A empresa introduziu uma solução de agrupamento de computação que reduziu o uso de GPU da Nvidia em 82% nas operações de serviço de modelos. Este avanço posiciona a Alibaba Cloud à frente na corrida para otimizar a implementação de IA em escala.
Alibaba Cloud, o braço de computação nuvem da empresa com sede em Hangzhou, implementou um novo sistema chamado Aegaeon para aumentar a eficiência da IA. A solução permite que uma única GPU Nvidia H20 sirva até sete modelos de linguagem grandes simultaneamente. Esta mudança reduziu o uso de GPU de 1.192 para apenas 213 unidades durante testes internos.
Aegaeon funciona realizando escala automatica a nível de token durante a inferência de modelos em cargas de trabalho de IA simultâneas. Esta estratégia permite a realocação dinâmica de recursos, permitindo que a mesma GPU alterne entre modelos durante o processamento. Também reduziu a latência nas tarefas de troca de modelos em 97%.
A solução foi testada em versão beta por mais de três meses no marketplace Bailian da Alibaba Cloud. Ela lidou com dezenas de modelos com até 72 bilhões de parâmetros sem degradação do serviço. Aegaeon foi agora formalmente implementado no marketplace de modelos da Alibaba, que serve seus modelos proprietários Qwen.
Alibaba Cloud descobriu que apenas um pequeno número de modelos é frequentemente usado em tarefas de IA do mundo real. Apesar disso, muitas GPUs foram alocadas para modelos raramente chamados, resultando em baixa utilização de recursos. Os dados mostraram que 17,7% das GPUs atendiam apenas 1,35% do total de solicitações de inferência.
Com Aegaeon, a empresa resolveu este desequilíbrio através de estratégias de agrupamento e escalonamento inteligente. O sistema garantiu o uso consistente de GPU e evitou o processamento ocioso em modelos raramente utilizados. A Alibaba alcançou maior throughput e melhorou a eficiência de hardware para implementações empresariais.
Pesquisadores da Universidade de Pequim e da Alibaba Cloud co-escreveram um artigo técnico detalhando a inovação, apresentado no SOSP 2025 na Coreia do Sul. O estudo sublinhou que servir cargas de trabalho simultâneas com métodos tradicionais de GPU incorria em custos desnecessários. Este avanço apoia diretamente o objetivo da China de modernização da infraestrutura de IA sob restrições de recursos.
A Nvidia desenvolveu a GPU H20 especificamente para inferência de IA na China, cumprindo com as restrições de exportação dos EUA. No entanto, reguladores chineses recentemente lançaram uma investigação sobre possíveis vulnerabilidades de segurança de backdoor no chip. Este escrutínio afetou a posição de mercado do chip e sua adoção dentro da China.
Empresas chinesas como Huawei e Cambricon estão acelerando o desenvolvimento de GPUs domésticas para reduzir a dependência estrangeira. O CEO da Nvidia afirmou que a participação de mercado da empresa para chips de IA avançados na China caiu para zero. Esta tendência impulsiona os players locais a inovar e localizar as cadeias de suprimentos de hardware de IA.
A nova abordagem da Alibaba fortalece sua posição no mercado enquanto se alinha com estratégias nacionais para autossuficiência tecnológica. Ao reduzir a dependência de chips dos EUA, a Alibaba ganha uma posição mais forte no ecossistema de IA em evolução da China. O aumento das ações reflete a confiança nas economias de custos lideradas pela tecnologia e na escalabilidade.
O post Alibaba Group Holding Limited (BABA) stock soars as new AI pooling tech slashes Nvidia GPU use by 82% apareceu primeiro no CoinCentral.


