Este artigo apresenta um estudo de ablação confirmando que uma taxa de aprendizagem adaptativa, por etapa e por camada, é essencial para o framework RECKONING.Este artigo apresenta um estudo de ablação confirmando que uma taxa de aprendizagem adaptativa, por etapa e por camada, é essencial para o framework RECKONING.

Estudo de ablação confirma necessidade de taxas dinâmicas para o desempenho do RECKONING

2025/10/29 23:38
Leu 3 min
Para enviar feedbacks ou expressar preocupações a respeito deste conteúdo, contate-nos em crypto.news@mexc.com

Resumo e 1. Introdução

  1. Antecedentes

  2. Método

  3. Experiências

    4.1 Desempenho de Raciocínio Multi-hop

    4.2 Raciocínio com Distratores

    4.3 Generalização para Conhecimento do Mundo Real

    4.4 Análise de Tempo de Execução

    4.5 Memorização de Conhecimento

  4. Trabalhos Relacionados

  5. Conclusão, Agradecimentos e Referências

\ A. Conjunto de Dados

B. Raciocínio em Contexto com Distratores

C. Detalhes de Implementação

D. Taxa de Aprendizagem Adaptativa

E. Experiências com Modelos de Linguagem Grandes

D Taxa de Aprendizagem Adaptativa

Trabalhos anteriores [3, 4] mostram que uma taxa de aprendizagem fixa compartilhada entre etapas e parâmetros não beneficia o desempenho de generalização do sistema. Em vez disso, [3] recomenda aprender uma taxa de aprendizagem para

\ Tabela 8: Um exemplo de raciocínio de 6 saltos do conjunto de dados CLUTRR-SG.

\ Tabela 9: Exemplo de distratores (preto) e conhecimento relevante (vermelho) no conjunto de dados ProofWriter.

\ cada camada de rede e cada etapa de adaptação no loop interno. Os parâmetros da camada podem aprender a ajustar as taxas de aprendizagem dinamicamente em cada etapa. Para controlar a taxa de aprendizagem α no loop interno de forma adaptativa, definimos α como um conjunto de variáveis ajustáveis: α = {α0, α1, …αL}, onde L é o número de camadas e para cada l = 0, …, L, αl é um vetor com N elementos dado um número de etapas de loop interno pré-definido N. A equação de atualização do loop interno torna-se então

\

\

\ As taxas de aprendizagem dinâmicas são necessárias para o desempenho do RECKONING? Seguindo trabalhos anteriores sobre meta-aprendizagem [3, 4], aprendemos dinamicamente um conjunto de taxas de aprendizagem por etapa e por camada para o RECKONING. Neste estudo de ablação, analisamos se as taxas de aprendizagem dinâmicas para o loop interno melhoram efetivamente o desempenho de raciocínio do loop externo. Da mesma forma, fixamos outras configurações experimentais e definimos o número de etapas do loop interno para 4. Como mostra a Figura 8, ao usar uma taxa de aprendizagem estática (ou seja, todas as camadas e etapas do loop interno compartilham uma taxa de aprendizagem constante), o desempenho cai por uma grande margem (queda média de 34,2%). A queda de desempenho torna-se mais significativa em questões que requerem mais saltos de raciocínio (queda de 45,5% para 4 saltos e 39,5% para 6 saltos), demonstrando a importância de usar uma taxa de aprendizagem dinâmica no loop interno do nosso framework.

\ Figura 8: Estudamos quanto a taxa de aprendizagem dinâmica no loop interno contribui para o desempenho do loop externo. Fixamos todos os hiperparâmetros exceto a opção de usar a taxa de aprendizagem dinâmica ou fixa. Realizamos a análise usando o conjunto de dados CLUTRR-SG, pois é mais complexo e difícil (desempenho aleatório mais baixo).

\

:::info Autores:

(1) Zeming Chen, EPFL (zeming.chen@epfl.ch);

(2) Gail Weiss, EPFL (antoine.bosselut@epfl.ch);

(3) Eric Mitchell, Stanford University (eric.mitchell@cs.stanford.edu)';

(4) Asli Celikyilmaz, Meta AI Research (aslic@meta.com);

(5) Antoine Bosselut, EPFL (antoine.bosselut@epfl.ch).

:::


:::info Este artigo está disponível no arxiv sob licença CC BY 4.0 DEED.

:::

\

Oportunidade de mercado
Logo de Solayer
Cotação Solayer (LAYER)
$0.08228
$0.08228$0.08228
+0.72%
USD
Gráfico de preço em tempo real de Solayer (LAYER)
Isenção de responsabilidade: Os artigos republicados neste site são provenientes de plataformas públicas e são fornecidos apenas para fins informativos. Eles não refletem necessariamente a opinião da MEXC. Todos os direitos permanecem com os autores originais. Se você acredita que algum conteúdo infringe direitos de terceiros, entre em contato pelo e-mail crypto.news@mexc.com para solicitar a remoção. A MEXC não oferece garantias quanto à precisão, integridade ou atualidade das informações e não se responsabiliza por quaisquer ações tomadas com base no conteúdo fornecido. O conteúdo não constitui aconselhamento financeiro, jurídico ou profissional, nem deve ser considerado uma recomendação ou endosso por parte da MEXC.

USD1 Genesis: 0 Fees + 12% APR

USD1 Genesis: 0 Fees + 12% APRUSD1 Genesis: 0 Fees + 12% APR

New users: stake for up to 600% APR. Limited time!