Купить крипто Рынки Спот Фьючерсы OILOIL Сбережения Центр событий

Еще

Исследование подтверждает, что способность RECKONING распутывать соответствующие знания сохраняется даже при масштабировании размера модели с использованием GPT-2-XL-LoRAИсследование подтверждает, что способность RECKONING распутывать соответствующие знания сохраняется даже при масштабировании размера модели с использованием GPT-2-XL-LoRA

Устойчивость к отвлекающим факторам: RECKONING значительно превосходит FT-ICR в рассуждениях о нерелевантных фактах

Источник: Hackernoon

2025/10/25 01:09

3м. чтение

Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу crypto.news@mexc.com

Таблица ссылок

Резюме и 1. Введение

Фон
Метод
Эксперименты

4.1 Производительность многоходового рассуждения

4.2 Рассуждение с дистракторами

4.3 Обобщение на знания реального мира

4.4 Анализ времени выполнения

4.5 Запоминание знаний
Связанные работы
Заключение, благодарности и ссылки

\ A. Набор данных

B. Контекстное рассуждение с дистракторами

C. Детали реализации

D. Адаптивная скорость обучения

E. Эксперименты с большими языковыми моделями

4.2 Рассуждение с дистракторами

В случаях, когда на один и тот же набор знаний необходимо ответить на несколько вопросов, некоторые знания, релевантные для одного вопроса, вероятно, будут нерелевантными для другого. Например, в Таблице 7 факт "Чарли белый" не нужен для ответа на вопрос "Гарри красный?". Таким образом, важно оценить устойчивость RECKONING при наличии нерелевантной информации (т.е. дистракторов) в наборе знаний. В этом эксперименте мы анализируем способность RECKONING фокусироваться на правильных знаниях и игнорировать дистракторы при ответе на вопросы. Мы используем ProofWriter в качестве набора данных для оценки, поскольку он уже имеет настройку с дистракторами, включенными в знания. Для систематического анализа мы постепенно добавляем дистракторы в контекст (начиная с 2 и заканчивая всеми возможными дистракторами, которых в среднем 7 на вопрос). Мы обучаем RECKONING и базовую модель, используя многозадачную цель, где модель должна (1) вспомнить все факты и правила, релевантные для вопроса, и (2) предсказать вывод на основе правильных знаний. В этом случае мы адаптируем обучение таким образом, что для каждого вопроса x потеря CLM внешнего цикла (Уравнение (5)) вычисляется только относительно релевантных фактов из K, тем самым обучаясь вспоминать только релевантные факты во время обучения.

\ На Рисунке 5 мы видим, что производительность RECKONING стабильно более устойчива к дистракторам, чем базовая модель FT-ICR. Когда мы включаем все дистракторы в контекст, RECKONING достигает значительно более высокой средней точности меток (82,5%) по всем переходам, чем базовая модель (70,9%), как вычислено по среднему значению 3 рассматриваемых глубин переходов. Кроме того, по сравнению с производительностью без дистракторов, производительность RECKONING падает только на 17,1%, в то время как производительность базовой модели падает на 28,6%, тем самым демонстрируя лучшую способность отделять правильные знания от дистракторов.

\ Наконец, мы также исследуем обобщаемость RECKONING на модели с большим размером параметров. Мы масштабируем используемую нами языковую модель, GPT-2-small (124M), до GPT-2-XL (1,5B), применяя метод эффективной тонкой настройки параметров LoRA [33]. Для простоты мы оцениваем модели только на самых сложных настройках, т.е. ProofWriter-5-hop со всеми дистракторами. С GPT-2-XL-LoRA контекстное рассуждение достигает 65% точности на тестовом наборе, в то время как наша модель RECKONING достигает 70,2% точности, что на 5% больше. Этот результат предполагает, что преимущества RECKONING в присутствии дистракторов сохраняются даже при увеличении размера моделей.

:::info Авторы:

(1) Zeming Chen, EPFL (zeming.chen@epfl.ch);

(2) Gail Weiss, EPFL (antoine.bosselut@epfl.ch);

(3) Eric Mitchell, Stanford University (eric.mitchell@cs.stanford.edu)';

(4) Asli Celikyilmaz, Meta AI Research (aslic@meta.com);

(5) Antoine Bosselut, EPFL (antoine.bosselut@epfl.ch).

:::

:::info Эта статья доступна на arxiv по лицензии CC BY 4.0 DEED.

:::

Получите 20 USDT за 1 минуту

Внесите 100$ и разблокируйте позиции GOLD на 300$

Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу crypto.news@mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Новости 24/7 в прямом эфире

Еще

HYPE превзошёл BTC, ETH, TAO, индекс S&P 500 и золото, продемонстрировав значительную рыночную силу.

Автор: JohnNakamoto23:14

RENDER прерывает нисходящий тренд, длившийся 16 месяцев, сигнализируя о потенциальном развороте рынка.

Автор: Dami-Defi23:00

XRP превосходит биткоин по притоку средств в ETF, что подчёркивает изменяющуюся динамику рынка и рост интереса со стороны институциональных инвесторов.

Автор: Ripple Bull Winkle | Crypto Researcher 🚀🚨22:04

Снижение танкерного трафика через Ормуз до месячного минимума может повлиять на динамику рынка USOIL.

Автор: Crypto Aman22:03

HYPE показывает рост на 65%, опережая BTC, ETH, TAO, индекс S&P 500 и золото. Демонстрирует значительную рыночную силу.

Автор: JohnNakamoto21:54

Быстрое чтение

Еще

Цены на криптовалюту

Биткоин

BTC

$71,979.05

$71,979.05$71,979.05

+0.93%

Эфириум

ETH

$2,211.76

$2,211.76$2,211.76

-0.16%

Bittensor

TAO

$334.37

$334.37$334.37

-0.69%

Рипл

XRP

$1.3488

$1.3488$1.3488

-0.47%

Солана

SOL

$83.19

$83.19$83.19

-0.19%

30 000$ в PRL + 15 000 USDT

Вносите депозит и торгуйте PRL для роста наград!

Устойчивость к отвлекающим факторам: RECKONING значительно превосходит FT-ICR в рассуждениях о нерелевантных фактах

Таблица ссылок

4.2 Рассуждение с дистракторами

Вам также может быть интересно

Pebblebee революционизирует личную безопасность с новой инициативой "Safe Haven" и устройством "Halo"

Индекс S&P 500 может достичь рекордного максимума в этом году: вот почему

Инновационный финансовый инструмент привлекает интерес на рынке криптовалют

Популярные новости

Северокорейские киберразведчики больше не являются лишь удаленными угрозами

Fartcoin падает на 10,8% несмотря на сильный недельный рост: Анализ волатильности мем-коина

Coinspaid расширяет доступ к инфраструктуре стейблкоинов для основателей через партнерство с The Residency

Tejas Networks получает Golden Peacock: инновации RAN, улучшающие клиентский опыт

Дела идут плохо в World Liberty Financial (WLFI), поддерживаемом президентом США Дональдом Трампом: утверждается, что это единственное решение для убытков!

Новости 24/7 в прямом эфире

Быстрое чтение

Прогноз цены BNB на 2026 год: будет ли BNB на уровне 612 долларов вашим последним шансом купить перед следующим ралли?

Скрытые ловушки разума в торговле BEEG: 7 когнитивных предубеждений, которые бесшумно истощают ваш криптопортфель

BEEG и Meme Coin Mirage: почему "простые" токены являются самой сложной торговлей в криптовалюте

Темная сторона BEEG, о которой вас никто не предупреждает: 5 скрытых рисков инвестирования в BEEG

Почему большие деньги продолжают ошибаться: край информационной асимметрии, который упускают большинство инвесторов

Цены на криптовалюту