Together AI Lança DeepSeek-V3.1: Um Modelo Híbrido Versátil

Terrill Dicki
25 de ago de 2025 23:56

A Together AI apresenta o DeepSeek-V3.1, um modelo híbrido que oferece respostas rápidas e modos de raciocínio profundo, garantindo eficiência e fiabilidade para várias aplicações.

A Together AI revelou o DeepSeek-V3.1, um modelo híbrido avançado projetado para atender tanto aos requisitos de resposta rápida quanto às tarefas de raciocínio complexo. O modelo, agora disponível para implementação na plataforma da Together AI, é particularmente conhecido pela sua funcionalidade de modo duplo, permitindo aos utilizadores selecionar entre modos de não-pensamento e pensamento para otimizar o desempenho com base na complexidade da tarefa.

Características e Capacidades

O DeepSeek-V3.1 foi criado para proporcionar maior eficiência e fiabilidade, de acordo com a Together AI. Suporta implementação sem servidor com um SLA de 99,9%, garantindo um desempenho robusto em diversos casos de uso. O modo de pensamento do modelo oferece qualidade comparável ao seu antecessor, DeepSeek-R1, mas com uma melhoria significativa na velocidade, tornando-o adequado para ambientes de produção.

O modelo é construído sobre um conjunto de dados de treino substancial, com 630 mil milhões de tokens para contexto de 32K e 209 mil milhões de tokens para contexto de 128K, melhorando a sua capacidade de lidar com conversas extensas e grandes bases de código. Isto garante que o modelo está bem equipado para tarefas que exigem análise detalhada e raciocínio em várias etapas.

Aplicações no Mundo Real

O DeepSeek-V3.1 destaca-se em várias aplicações, incluindo tarefas de código e Agente de IA de pesquisa. No modo de não-pensamento, lida eficientemente com tarefas rotineiras como geração de endpoints de API e consultas simples. Em contraste, o modo de pensamento é ideal para resolução de problemas complexos, como depuração de sistemas distribuídos e design de migrações de base de dados sem tempo de inatividade.

Para processamento de documentos, o modelo oferece capacidades de não-pensamento para extração de entidades e análise básica, enquanto o modo de pensamento suporta análise abrangente de fluxos de trabalho de conformidade e referência cruzada regulatória.

Métricas de Desempenho

Os testes de referência revelam os pontos fortes do modelo em ambos os modos. Por exemplo, no benchmark MMLU-Redux, o modo de pensamento alcançou uma taxa de sucesso de 93,7%, superando o modo de não-pensamento em 1,9%. Da mesma forma, o benchmark GPQA-Diamond mostrou uma melhoria de 5,2% no modo de pensamento. Estas métricas sublinham a capacidade do modelo de melhorar o desempenho em várias tarefas.

Implementação e Integração

O DeepSeek-V3.1 está disponível através da API sem servidor da Together AI e endpoints dedicados, oferecendo especificações técnicas com 671 mil milhões de parâmetros totais e uma licença MIT para aplicação extensiva. A infraestrutura é projetada para fiabilidade, apresentando centros de dados norte-americanos e conformidade com SOC 2.

Os desenvolvedores podem integrar rapidamente o modelo nas suas aplicações usando o SDK Python fornecido, permitindo a incorporação perfeita das capacidades do DeepSeek-V3.1 em sistemas existentes. A infraestrutura da Together AI suporta grandes modelos de mistura de especialistas, garantindo que tanto os modos de pensamento quanto os de não-pensamento operem eficientemente sob cargas de trabalho de produção.

Com o lançamento do DeepSeek-V3.1, a Together AI visa fornecer uma solução versátil para empresas que procuram melhorar as suas aplicações Impulsionadas por IA com capacidades de resposta rápida e análise profunda.

Fonte da imagem: Shutterstock

Fonte: https://blockchain.news/news/together-ai-launches-deepseek-v3-1-versatile-hybrid-model