A NVIDIA oferece agora acesso gratuito à API acelerada por GPU ao Kimi K2.5, um modelo de IA multimodal de 1T parâmetros com 384 especialistas e comprimento de contexto de 262K para programadores. (LerA NVIDIA oferece agora acesso gratuito à API acelerada por GPU ao Kimi K2.5, um modelo de IA multimodal de 1T parâmetros com 384 especialistas e comprimento de contexto de 262K para programadores. (Ler

NVIDIA Lança Endpoints Acelerados por GPU para o Modelo Kimi K2.5 da Moonshot AI

2026/02/05 04:11
Leu 3 min

NVIDIA Lança Endpoints Acelerados por GPU para o Modelo Kimi K2.5 da Moonshot AI

Jessie A Ellis 04 de fev. de 2026 20:11

A NVIDIA oferece agora acesso gratuito à API acelerada por GPU para o Kimi K2.5, um modelo de IA multimodal de 1T parâmetros com 384 especialistas e comprimento de contexto de 262K para programadores.

NVIDIA Lança Endpoints Acelerados por GPU para o Modelo Kimi K2.5 da Moonshot AI

A NVIDIA lançou endpoints acelerados por GPU para o Kimi K2.5 da Moonshot AI, proporcionando aos programadores acesso gratuito à API de um dos modelos multimodais de código aberto mais capazes atualmente disponíveis. A integração, anunciada a 4 de fevereiro de 2026, posiciona o modelo de 1 trilião de parâmetros para adoção empresarial rápida através da plataforma build.nvidia.com da NVIDIA.

O Kimi K2.5 apresenta especificações técnicas sérias que são importantes para implementações em produção. O modelo utiliza uma arquitetura Mixture-of-Experts com 384 especialistas, ativando apenas 32,86 mil milhões de parâmetros por token—uma taxa de ativação de 3,2% que mantém os custos de inferência geríveis apesar da contagem massiva de parâmetros. O comprimento do contexto estende-se a 262.000 tokens, lidando com análise substancial de documentos e conversas prolongadas.

As capacidades de visão merecem atenção. A Moonshot construiu uma MoonViT3d Vision Tower personalizada que processa imagens e frames de vídeo em embeddings, suportada por um vocabulário de 164.000 tokens contendo tokens específicos de visão. Isto não é multimodalidade acoplada—é nativo à arquitetura.

O Que os Programadores Recebem

O acesso gratuito de prototipagem através do Programa de Programadores da NVIDIA significa que as equipas podem testar contra cargas de trabalho de produção antes de comprometer infraestrutura. A API segue padrões compatíveis com OpenAI, incluindo suporte de chamada de ferramentas para fluxos de trabalho agênticos. Os microserviços NVIDIA NIM para inferência de produção contentorizada estão a chegar, embora nenhum cronograma específico tenha sido fornecido.

Para implementações auto-hospedadas, a integração vLLM está pronta agora. A NVIDIA também confirmou suporte de ajuste fino através do NeMo Framework de código aberto, usando o NeMo AutoModel para personalizar o modelo diretamente a partir de checkpoints do Hugging Face sem etapas de conversão.

Contexto de Mercado

A Moonshot AI lançou o Kimi K2.5 a 27 de janeiro de 2026, treinando-o em aproximadamente 15 triliões de tokens visuais e de texto mistos construídos sobre a fundação K2 anterior. O modelo tem atraído comparações diretas com o Gemini 3 Pro da Google, publicando benchmarks competitivos incluindo uma pontuação de 78,5% nos testes de compreensão visual MMMU-Pro e 76,8% no SWE-Bench Verified para tarefas de codificação.

Uma funcionalidade diferenciadora: o mecanismo "Agent Swarm" que coordena até 100 sub-agentes paralelos, supostamente reduzindo o tempo de execução em 4,5x versus abordagens de agente único. Para empresas que constroem sistemas autónomos complexos, essa é uma lacuna de capacidade significativa.

O suporte da arquitetura Blackwell da NVIDIA sugere que a empresa vê o Kimi K2.5 como um concorrente sério em implementações de IA empresarial. Os programadores podem aceder ao modelo imediatamente através de build.nvidia.com ou através da Plataforma de API Kimi diretamente da Moonshot.

Fonte da imagem: Shutterstock
  • nvidia
  • kimi k2.5
  • moonshot ai
  • ia multimodal
  • computação gpu
Oportunidade de mercado
Logo de NodeAI
Cotação NodeAI (GPU)
$0.02561
$0.02561$0.02561
-1.19%
USD
Gráfico de preço em tempo real de NodeAI (GPU)
Isenção de responsabilidade: Os artigos republicados neste site são provenientes de plataformas públicas e são fornecidos apenas para fins informativos. Eles não refletem necessariamente a opinião da MEXC. Todos os direitos permanecem com os autores originais. Se você acredita que algum conteúdo infringe direitos de terceiros, entre em contato pelo e-mail service@support.mexc.com para solicitar a remoção. A MEXC não oferece garantias quanto à precisão, integridade ou atualidade das informações e não se responsabiliza por quaisquer ações tomadas com base no conteúdo fornecido. O conteúdo não constitui aconselhamento financeiro, jurídico ou profissional, nem deve ser considerado uma recomendação ou endosso por parte da MEXC.