Comprar cripto Mercados Spot FuturosGOLD Ganhe Centro de eventos

Mais

Este artigo apresenta um estudo de ablação confirmando que uma taxa de aprendizagem adaptativa, por etapa e por camada, é essencial para o framework RECKONING.Este artigo apresenta um estudo de ablação confirmando que uma taxa de aprendizagem adaptativa, por etapa e por camada, é essencial para o framework RECKONING.

Estudo de ablação confirma necessidade de taxas dinâmicas para o desempenho do RECKONING

Fonte: Hackernoon

2025/10/29 23:38

Leu 3 min

LAYER$0.08228+0.04%

Para enviar feedbacks ou expressar preocupações a respeito deste conteúdo, contate-nos em crypto.news@mexc.com

Tabela de Links

Resumo e 1. Introdução

Antecedentes
Método
Experiências

4.1 Desempenho de Raciocínio Multi-hop

4.2 Raciocínio com Distratores

4.3 Generalização para Conhecimento do Mundo Real

4.4 Análise de Tempo de Execução

4.5 Memorização de Conhecimento
Trabalhos Relacionados
Conclusão, Agradecimentos e Referências

\ A. Conjunto de Dados

B. Raciocínio em Contexto com Distratores

C. Detalhes de Implementação

D. Taxa de Aprendizagem Adaptativa

E. Experiências com Modelos de Linguagem Grandes

D Taxa de Aprendizagem Adaptativa

Trabalhos anteriores [3, 4] mostram que uma taxa de aprendizagem fixa compartilhada entre etapas e parâmetros não beneficia o desempenho de generalização do sistema. Em vez disso, [3] recomenda aprender uma taxa de aprendizagem para

\ Tabela 8: Um exemplo de raciocínio de 6 saltos do conjunto de dados CLUTRR-SG.

\ Tabela 9: Exemplo de distratores (preto) e conhecimento relevante (vermelho) no conjunto de dados ProofWriter.

\ cada camada de rede e cada etapa de adaptação no loop interno. Os parâmetros da camada podem aprender a ajustar as taxas de aprendizagem dinamicamente em cada etapa. Para controlar a taxa de aprendizagem α no loop interno de forma adaptativa, definimos α como um conjunto de variáveis ajustáveis: α = {α0, α1, …αL}, onde L é o número de camadas e para cada l = 0, …, L, αl é um vetor com N elementos dado um número de etapas de loop interno pré-definido N. A equação de atualização do loop interno torna-se então

\ As taxas de aprendizagem dinâmicas são necessárias para o desempenho do RECKONING? Seguindo trabalhos anteriores sobre meta-aprendizagem [3, 4], aprendemos dinamicamente um conjunto de taxas de aprendizagem por etapa e por camada para o RECKONING. Neste estudo de ablação, analisamos se as taxas de aprendizagem dinâmicas para o loop interno melhoram efetivamente o desempenho de raciocínio do loop externo. Da mesma forma, fixamos outras configurações experimentais e definimos o número de etapas do loop interno para 4. Como mostra a Figura 8, ao usar uma taxa de aprendizagem estática (ou seja, todas as camadas e etapas do loop interno compartilham uma taxa de aprendizagem constante), o desempenho cai por uma grande margem (queda média de 34,2%). A queda de desempenho torna-se mais significativa em questões que requerem mais saltos de raciocínio (queda de 45,5% para 4 saltos e 39,5% para 6 saltos), demonstrando a importância de usar uma taxa de aprendizagem dinâmica no loop interno do nosso framework.

\ Figura 8: Estudamos quanto a taxa de aprendizagem dinâmica no loop interno contribui para o desempenho do loop externo. Fixamos todos os hiperparâmetros exceto a opção de usar a taxa de aprendizagem dinâmica ou fixa. Realizamos a análise usando o conjunto de dados CLUTRR-SG, pois é mais complexo e difícil (desempenho aleatório mais baixo).

:::info Autores:

(1) Zeming Chen, EPFL (zeming.chen@epfl.ch);

(2) Gail Weiss, EPFL (antoine.bosselut@epfl.ch);

(3) Eric Mitchell, Stanford University (eric.mitchell@cs.stanford.edu)';

(4) Asli Celikyilmaz, Meta AI Research (aslic@meta.com);

(5) Antoine Bosselut, EPFL (antoine.bosselut@epfl.ch).

:::

:::info Este artigo está disponível no arxiv sob licença CC BY 4.0 DEED.

:::

Oportunidade de mercado

Cotação Solayer (LAYER)

$0.08228

$0.08228$0.08228

+0.72%

USD

Gráfico de preço em tempo real de Solayer (LAYER)

Ganhe 20 USDT em apenas 1 minuto

Deposite $100 para desbloquear $300 em posições GOLD

Isenção de responsabilidade: Os artigos republicados neste site são provenientes de plataformas públicas e são fornecidos apenas para fins informativos. Eles não refletem necessariamente a opinião da MEXC. Todos os direitos permanecem com os autores originais. Se você acredita que algum conteúdo infringe direitos de terceiros, entre em contato pelo e-mail crypto.news@mexc.com para solicitar a remoção. A MEXC não oferece garantias quanto à precisão, integridade ou atualidade das informações e não se responsabiliza por quaisquer ações tomadas com base no conteúdo fornecido. O conteúdo não constitui aconselhamento financeiro, jurídico ou profissional, nem deve ser considerado uma recomendação ou endosso por parte da MEXC.

Notícias em alta

Mais

Cộng đồng dYdX dùng 10 triệu USDC từ quỹ bảo hiểm cấp vốn DAO

Republicano do Sul despedaçado por bajulação 'abjeta' a Trump

FF tăng 137% sáng sớm rồi giảm, 115 triệu coin rời ví lên sàn

Próximo Sinal de Cripto 100x Cai Enquanto Opções de BTC Visam $80.000 e Uma Pré-venda Preenche Todas as Fases

Tesouro dos EUA Lança Iniciativa de Cibersegurança para a Indústria Cripto

Notícias ao vivo 24/7

Mais

O Irão aceita Bitcoin para a passagem pelo Estreito de Ormuz, criando uma procura diária de cerca de 3.600 BTC por aproximadamente 130 navios.

Autor: Charles 👑10:35

Solana destacada como um dos principais intervenientes para o ciclo de 2023-2024, com potencial atenção do mercado assinalada.

Autor: borovik10:26

Sistema de condução autónoma da TESLA aprovado pelo regulador holandês, podendo influenciar o sentimento do mercado cripto relacionado.

Autor: Charles 👑10:24

Segundo relatos, os bancos mostram uma dependência crescente do XRP, destacando o seu papel em evolução nos sistemas financeiros.

Autor: Ripple Bull Winkle | Crypto Researcher 🚀🚨10:01

A aprovação regulatória destaca a necessidade da tecnologia da Ripple, sinalizando potenciais mudanças na relevância de mercado do XRP e na dependência institucional.

Autor: Ripple Bull Winkle | Crypto Researcher 🚀🚨09:01