LangChain надає ШІ-агентам контроль над власним управлінням пам'яттю
Terrill Dicki 01:55, 12 березня 2026
Deep Agents SDK від LangChain тепер дозволяє моделям ШІ самостійно вирішувати, коли стискати вікна контексту, зменшуючи ручне втручання в тривалі робочі процеси агентів.
LangChain випустив оновлення для свого Deep Agents SDK, яке передає моделям ШІ ключі до власного управління пам'яттю. Нова функція, анонсована 11 березня 2026 року, дозволяє агентам автономно запускати стиснення контексту замість покладання на фіксовані порогові значення токенів або ручні команди користувача.
Ця зміна вирішує постійну проблему в розробці агентів: вікна контексту заповнюються в невідповідний час. Поточні системи зазвичай стискають пам'ять при досягненні 85% ліміту контексту моделі — що може статися в середині рефакторингу або під час складного сеансу налагодження. Погана синхронізація призводить до втрати контексту та порушення робочих процесів.
Чому синхронізація має значення
Стиснення контексту не є новинкою. Метод замінює старіші повідомлення стислими резюме, щоб утримати агентів у межах їхніх лімітів токенів. Але коли ви стискаєте, має таке ж значення, як і те, чи стискаєте ви взагалі.
Реалізація LangChain визначає кілька оптимальних моментів стиснення: межі завдань, коли користувачі змінюють фокус, після отримання висновків з великих дослідницьких контекстів або перед початком тривалого редагування декількох файлів. Агент, по суті, навчається прибирати перед початком складної роботи, а не метушитися, коли закінчується місце.
Дослідження Factory AI, опубліковане в грудні 2024 року, підтверджує цей підхід. Їхній аналіз показав, що структуроване узагальнення — збереження безперервності контексту замість агресивного усічення — виявилося критичним для складних завдань агентів, таких як налагодження. Агенти, які підтримували структуру робочого процесу, значно перевершували тих, хто використовував прості методи відсікання.
Технічна реалізація
Інструмент постачається як проміжне програмне забезпечення для Deep Agents SDK (Python) і інтегрується з існуючим CLI. Розробники додають його до конфігурації свого агента:
Система зберігає 10% доступного контексту як останні повідомлення, узагальнюючи все попереднє. LangChain вбудував страхувальну сітку — повна історія розмови зберігається у віртуальній файловій системі агента, дозволяючи відновлення, якщо стиснення йде не так.
Внутрішнє тестування показало, що агенти консервативно підходять до запуску стиснення. LangChain перевірив функцію за допомогою свого еталонного тесту Terminal-bench-2 та спеціальних наборів оцінки за допомогою трасувань LangSmith. Коли агенти стискали автономно, вони послідовно обирали моменти, що покращували безперервність робочого процесу.
Ширша картина
Цей випуск відображає ширший зсув у філософії архітектури агентів. LangChain явно посилається на "гіркий урок" Річарда Саттона — спостереження, що загальні методи з використанням обчислень, як правило, перевершують ретельно налаштовані підходи з часом.
Замість того, щоб розробники ретельно налаштовували, коли агенти повинні керувати пам'яттю, фреймворк делегує це рішення самій моделі. Це ставка на те, що можливості міркування в моделях, таких як GPT-5.4, досягли точки, коли вони можуть приймати ці операційні рішення надійно.
Для розробників, які створюють тривалі або інтерактивні агенти, функція активується через SDK і доступна за допомогою команди /compact в CLI. Практичний вплив: менше перерваних робочих процесів і менше допомоги користувачам щодо лімітів контексту, які більшість кінцевих користувачів все одно не розуміє.
- langchain
- ШІ-агенти
- стиснення контексту
- deep agents sdk
- інструменти розробника



