Terrill Dicki
25 de ago de 2025 23:56
A Together AI apresenta o DeepSeek-V3.1, um modelo híbrido que oferece respostas rápidas e modos de raciocínio profundo, garantindo eficiência e fiabilidade para várias aplicações.
A Together AI revelou o DeepSeek-V3.1, um modelo híbrido avançado projetado para atender tanto aos requisitos de resposta rápida quanto às tarefas de raciocínio complexo. O modelo, agora disponível para implementação na plataforma da Together AI, é particularmente conhecido pela sua funcionalidade de modo duplo, permitindo aos utilizadores selecionar entre modos de não-pensamento e pensamento para otimizar o desempenho com base na complexidade da tarefa.
Características e Capacidades
O DeepSeek-V3.1 foi criado para proporcionar maior eficiência e fiabilidade, de acordo com a Together AI. Suporta implementação sem servidor com um SLA de 99,9%, garantindo um desempenho robusto em diversos casos de uso. O modo de pensamento do modelo oferece qualidade comparável ao seu antecessor, DeepSeek-R1, mas com uma melhoria significativa na velocidade, tornando-o adequado para ambientes de produção.
O modelo é construído sobre um conjunto de dados de treino substancial, com 630 mil milhões de tokens para contexto de 32K e 209 mil milhões de tokens para contexto de 128K, melhorando a sua capacidade de lidar com conversas extensas e grandes bases de código. Isto garante que o modelo está bem equipado para tarefas que exigem análise detalhada e raciocínio em várias etapas.
Aplicações no Mundo Real
O DeepSeek-V3.1 destaca-se em várias aplicações, incluindo tarefas de código e Agente de IA de pesquisa. No modo de não-pensamento, lida eficientemente com tarefas rotineiras como geração de endpoints de API e consultas simples. Em contraste, o modo de pensamento é ideal para resolução de problemas complexos, como depuração de sistemas distribuídos e design de migrações de base de dados sem tempo de inatividade.
Para processamento de documentos, o modelo oferece capacidades de não-pensamento para extração de entidades e análise básica, enquanto o modo de pensamento suporta análise abrangente de fluxos de trabalho de conformidade e referência cruzada regulatória.
Métricas de Desempenho
Os testes de referência revelam os pontos fortes do modelo em ambos os modos. Por exemplo, no benchmark MMLU-Redux, o modo de pensamento alcançou uma taxa de sucesso de 93,7%, superando o modo de não-pensamento em 1,9%. Da mesma forma, o benchmark GPQA-Diamond mostrou uma melhoria de 5,2% no modo de pensamento. Estas métricas sublinham a capacidade do modelo de melhorar o desempenho em várias tarefas.
Implementação e Integração
O DeepSeek-V3.1 está disponível através da API sem servidor da Together AI e endpoints dedicados, oferecendo especificações técnicas com 671 mil milhões de parâmetros totais e uma licença MIT para aplicação extensiva. A infraestrutura é projetada para fiabilidade, apresentando centros de dados norte-americanos e conformidade com SOC 2.
Os desenvolvedores podem integrar rapidamente o modelo nas suas aplicações usando o SDK Python fornecido, permitindo a incorporação perfeita das capacidades do DeepSeek-V3.1 em sistemas existentes. A infraestrutura da Together AI suporta grandes modelos de mistura de especialistas, garantindo que tanto os modos de pensamento quanto os de não-pensamento operem eficientemente sob cargas de trabalho de produção.
Com o lançamento do DeepSeek-V3.1, a Together AI visa fornecer uma solução versátil para empresas que procuram melhorar as suas aplicações Impulsionadas por IA com capacidades de resposta rápida e análise profunda.
Fonte da imagem: Shutterstock
Fonte: https://blockchain.news/news/together-ai-launches-deepseek-v3-1-versatile-hybrid-model








