TLDR A Alibaba reduz o uso de GPU em 82% com o Aegaeon, impulsionando a IA em escala massiva. O Aegaeon reduz a latência de troca de modelos de IA em 97%, aumentando o desempenho. Uma GPU Nvidia H20 agora executa 7 LLMs simultaneamente na atualização de IA da Alibaba. A Alibaba Cloud melhora a eficiência da GPU com escala automática a nível de token. O Aegaeon impulsiona os objetivos de IA da China enquanto reduz a dependência de chips Nvidia. [...] A publicação "As ações da Alibaba Group Holding Limited (BABA) disparam com nova tecnologia de pooling de IA que reduz o uso de GPU Nvidia em 82%" apareceu primeiro no CoinCentral.TLDR A Alibaba reduz o uso de GPU em 82% com o Aegaeon, impulsionando a IA em escala massiva. O Aegaeon reduz a latência de troca de modelos de IA em 97%, aumentando o desempenho. Uma GPU Nvidia H20 agora executa 7 LLMs simultaneamente na atualização de IA da Alibaba. A Alibaba Cloud melhora a eficiência da GPU com escala automática a nível de token. O Aegaeon impulsiona os objetivos de IA da China enquanto reduz a dependência de chips Nvidia. [...] A publicação "As ações da Alibaba Group Holding Limited (BABA) disparam com nova tecnologia de pooling de IA que reduz o uso de GPU Nvidia em 82%" apareceu primeiro no CoinCentral.

Ações da Alibaba Group Holding Limited (BABA) disparam à medida que nova tecnologia de pooling de IA reduz o uso de GPUs da Nvidia em 82%

2025/10/18 20:15
Leu 4 min
Para enviar feedbacks ou expressar preocupações a respeito deste conteúdo, contate-nos em crypto.news@mexc.com

TLDR

  • Alibaba reduz o uso de GPU em 82% com Aegaeon, impulsionando a IA em escala massiva.
  • Aegaeon reduz a latência de troca de modelos de IA em 97%, aumentando o desempenho.
  • Uma GPU Nvidia H20 agora executa 7 LLMs simultaneamente na atualização de IA da Alibaba.
  • Alibaba Cloud melhora a eficiência da GPU com escala automatica a nível de token.
  • Aegaeon impulsiona os objetivos de IA da China enquanto reduz a dependência de chips Nvidia.

Alibaba Group Holding Limited fechou em $167,05, marcando um aumento de 1,19%, após um grande avanço na infraestrutura de IA.

BABA Stock Card

Alibaba Group Holding Limited, BABA

A empresa introduziu uma solução de agrupamento de computação que reduziu o uso de GPU da Nvidia em 82% nas operações de serviço de modelos. Este avanço posiciona a Alibaba Cloud à frente na corrida para otimizar a implementação de IA em escala.

Aegaeon aumenta a eficiência, reduz a dependência de GPU

Alibaba Cloud, o braço de computação nuvem da empresa com sede em Hangzhou, implementou um novo sistema chamado Aegaeon para aumentar a eficiência da IA. A solução permite que uma única GPU Nvidia H20 sirva até sete modelos de linguagem grandes simultaneamente. Esta mudança reduziu o uso de GPU de 1.192 para apenas 213 unidades durante testes internos.

Aegaeon funciona realizando escala automatica a nível de token durante a inferência de modelos em cargas de trabalho de IA simultâneas. Esta estratégia permite a realocação dinâmica de recursos, permitindo que a mesma GPU alterne entre modelos durante o processamento. Também reduziu a latência nas tarefas de troca de modelos em 97%.

A solução foi testada em versão beta por mais de três meses no marketplace Bailian da Alibaba Cloud. Ela lidou com dezenas de modelos com até 72 bilhões de parâmetros sem degradação do serviço. Aegaeon foi agora formalmente implementado no marketplace de modelos da Alibaba, que serve seus modelos proprietários Qwen.

Insights do mercado de modelos e otimização de desempenho

Alibaba Cloud descobriu que apenas um pequeno número de modelos é frequentemente usado em tarefas de IA do mundo real. Apesar disso, muitas GPUs foram alocadas para modelos raramente chamados, resultando em baixa utilização de recursos. Os dados mostraram que 17,7% das GPUs atendiam apenas 1,35% do total de solicitações de inferência.

Com Aegaeon, a empresa resolveu este desequilíbrio através de estratégias de agrupamento e escalonamento inteligente. O sistema garantiu o uso consistente de GPU e evitou o processamento ocioso em modelos raramente utilizados. A Alibaba alcançou maior throughput e melhorou a eficiência de hardware para implementações empresariais.

Pesquisadores da Universidade de Pequim e da Alibaba Cloud co-escreveram um artigo técnico detalhando a inovação, apresentado no SOSP 2025 na Coreia do Sul. O estudo sublinhou que servir cargas de trabalho simultâneas com métodos tradicionais de GPU incorria em custos desnecessários. Este avanço apoia diretamente o objetivo da China de modernização da infraestrutura de IA sob restrições de recursos.

O papel da Nvidia e a mudança na estratégia de chips da China

A Nvidia desenvolveu a GPU H20 especificamente para inferência de IA na China, cumprindo com as restrições de exportação dos EUA. No entanto, reguladores chineses recentemente lançaram uma investigação sobre possíveis vulnerabilidades de segurança de backdoor no chip. Este escrutínio afetou a posição de mercado do chip e sua adoção dentro da China.

Empresas chinesas como Huawei e Cambricon estão acelerando o desenvolvimento de GPUs domésticas para reduzir a dependência estrangeira. O CEO da Nvidia afirmou que a participação de mercado da empresa para chips de IA avançados na China caiu para zero. Esta tendência impulsiona os players locais a inovar e localizar as cadeias de suprimentos de hardware de IA.

A nova abordagem da Alibaba fortalece sua posição no mercado enquanto se alinha com estratégias nacionais para autossuficiência tecnológica. Ao reduzir a dependência de chips dos EUA, a Alibaba ganha uma posição mais forte no ecossistema de IA em evolução da China. O aumento das ações reflete a confiança nas economias de custos lideradas pela tecnologia e na escalabilidade.

 

O post Alibaba Group Holding Limited (BABA) stock soars as new AI pooling tech slashes Nvidia GPU use by 82% apareceu primeiro no CoinCentral.

Oportunidade de mercado
Logo de Sleepless AI
Cotação Sleepless AI (SLEEPLESSAI)
$0.01924
$0.01924$0.01924
-1.48%
USD
Gráfico de preço em tempo real de Sleepless AI (SLEEPLESSAI)
Isenção de responsabilidade: Os artigos republicados neste site são provenientes de plataformas públicas e são fornecidos apenas para fins informativos. Eles não refletem necessariamente a opinião da MEXC. Todos os direitos permanecem com os autores originais. Se você acredita que algum conteúdo infringe direitos de terceiros, entre em contato pelo e-mail crypto.news@mexc.com para solicitar a remoção. A MEXC não oferece garantias quanto à precisão, integridade ou atualidade das informações e não se responsabiliza por quaisquer ações tomadas com base no conteúdo fornecido. O conteúdo não constitui aconselhamento financeiro, jurídico ou profissional, nem deve ser considerado uma recomendação ou endosso por parte da MEXC.

$30,000 em PRL + 15,000 USDT

$30,000 em PRL + 15,000 USDT$30,000 em PRL + 15,000 USDT

Deposite e negocie PRL e aumente suas recompensas!