Привет, меня зовут Лера. Работаю Head of Community / Marketing в школе Web3-разработки, но времена немного меняются. И тема этой статьи говорит за себя. По долгу своей службы вокруг меня постоянно проводят стримы, связанные с AI: автоматизация, вайбкод, личные ассистенты, оптимизация рабочих процессов. Ресёрч, подключение MCP и конечно же RAG.
Выбирая множество тем из огромного и хайпового сегмента нейросетей сложно ухватиться за что-то очень конкретное. Будь то вводная статья в тему, я бы вам рассказывала про LLM модели. Оно и многим понятно и доступно. Мне кажется, что каждый уже слышал про ChatGPT. Слышал казусные ситуации оттуда или видел аватарки в стиле студии Гибли. Это относительно понятное явление.
Но с другой стороны оно и слишком очевидное. Даже без особых знаний по написанию промптов, любой может найти способ оплатить подписку или протестировать бесплатно. Поговорить с нейросетью и либо закончить на этом, либо же пойти пробовать дальше.
Потому что сегодня без него в серьёзной работе с нейросетями никуда. Но кажется логичным всё же осветить тех, во что этот RAG и встраивается. А именно про AI-агентов или личных AI-ассистентов.
Поэтому я начну расписывать серию статей, беря за основу именно это, отталкиваясь от сборки чего-то личного под ваши задачи. И небольшая ремарка перед началом — в этих статьях я не буду пересказывать многочасовые стримы. Раскрою тему в немного вольной форме, самостоятельно проведя ресёрч и углубившись в тему ещё раз, отдельно и лично.
Заодно поведаю и вам, приятного прочтения!
Можно сказать, что современный стандарт, который предполагает повсеместное использование агентов. Потому что простой умный чат-бот мало в чём оказывается реально полезным. И наверное НЕ использовать AI-агентов как минимум странно.
Есть реализация полностью автономных, пользователям криптовалют может быть знакома ElizaOS, мы также её у себя отдельно разбирали, и там тема достойна отдельной статьи. Но в ~80% случаев AI-агент это LLM с хорошо прописанным промптом, который включает в себя подходящую роль.
Структура промпта для агента отличается от обычного запроса тем, что она должна быть инструктивной и ограничивающей. Агенту нужно чётко понимать не только «что делать», но и «как думать» и «какие инструменты использовать».
Вот классическая структура (фреймворк) эффективного промпта для AI-агента:
Role (Роль): Кем является агент? (Экспертность, тон, бэкграунд).
Objective (Цель/Задача): Что именно нужно достичь? Какой финальный результат считается успешным?
Context & Constraints (Контекст и Ограничения): В каких условиях работает агент? Что ему запрещено делать?
Tools & Resources (Инструменты): К каким API, базам данных или функциям у него есть доступ.
Chain of Thought / Process (Процесс мышления): Пошаговый алгоритм действий (Сначала сделай А, затем Б).
Output Format (Формат ответа): В каком виде выдать результат (JSON, Markdown, отчёт).
Хороший же AI-агент как раз включает в себя дополнительные инструменты. Не только для большего числа задач, вроде генерации изображения, видео и музыки под них. Но и для более точного и качественного результата.
Пожалуй я могу выделить несколько ключевых инструментов, которые в большинстве случаев оказываются не просто полезными, а жизненно необходимыми.
RAG — упомянут выше, это базис для всех агентов, которые понимают ваши документы, ваши продукты и могут ответить на любой вопрос из базы данных.
Отдельный дип-ресёрч, не кнопочка в LLM, а именно сервис ищущий актуальные данные сегодня, например Tavily с их бесплатным API
Оркестрация — объединение разных AI-агентов в одну команду, чтобы они последовательно или параллельно выполняли чётко поставленные задачи для достижения единой цели
И давайте немного упомяну именно автономных AI, попробуем разграничить разбираемое в этой статье и теорию.
Автономные AI‑агенты — это системы, которые не просто отвечают на запрос, а сами ставят подзадачи, планируют шаги и выполняют действия в внешнем мире (запускают команды, ходят в API, двигают деньги, пишут посты) с минимальным вмешательством человека.
Ключевые характеристики:
Цель, а не один запрос: ты задаёшь цель (например, «вести Twitter‑аккаунт» или «торговать мемкоинами по стратегии»), а не единичный промпт.
Петля планирования: агент сам составляет план (sub‑goals), рефлексирует, корректирует стратегию.
Доступ к инструментам: shell, HTTP‑API, блокчейн‑SDK, базы данных, браузер и т.д.
Автономный цикл: план → действие → наблюдение → рефлексия → следующий шаг без постоянных ручных подтверждений.
Вот написанные агенты на фреймворке ElizaOS сами по себе пишут твиты, проводят торговые операции в криптовалюте и просто живут без вмешательства человека. Они не решают ваши задачи, они постоянно решают поставленные задачи исходя из своих планов/ожиданий и хотелок. Насколько вообще уместно говорить о личных желаниях нейросети.
Ну вот вам вводная информация по теме для последующих статей, а сейчас посмотрим на самое начало. Хотим AI-агента для какой-либо задачи, как его создать, что использовать?
Визуальный конструктор workflow: drag‑and‑drop канвас, где можно собирать цепочки вызовов LLM, ветвления, параллельные ветки, код‑блоки и т.п.
Поддержка RAG: есть модуль для выгрузки данных из разных источников, преобразования и индексации во векторные БД, плюс готовые RAG‑пайплайны.
Агентные возможности: можно определять агентов (Function Calling / ReAct), навешивать на них инструменты, использовать 50+ встроенных тулов (поиск, DALL·E, Stable Diffusion, WolframAlpha и пр.).
По сути вы можете в несколько кликов в красивом UI собрать для себя простого чат-бота, которому подключаются инструменты/скиллы + нужная LLM. Здесь не нужно никаких навыков, лишь немного ресёрча.
Более того, вы можете запустить сервис на своих локальных решениях, используя модели из Ollama, а также подключить туда членов своей команды.
При желании можно даже ничего не запускать, отказаться от развёртки в докере за минут 5, а выбрать платный тариф и использовать Dify как коммерческое решение.
На скромный взгляд десятка наших учеников, людей из индустрии/тусовки и моему собственному мнению — Claude Code это реальное чудо. И ключевая причина в системе скиллов и плагинов. А не автоматизация, заточенная под Unix, хотя и этот аспект сверхкруто сделан и продуман.
И упомянутые RAG, оркестрация и конечно сами AI-агенты — это то, что здесь можно запустить/развернуть и создать за минут 5-15, чисто на энтузиазме и силе вайбкода. Как минимум упростив себе жизнь, автоматизировав команды и нудные участки кода, которые не хочется писать лично.
И сразу ремарка, что если ChatGPT пишет отвратительный код это не значит, что Claude пишет его примерно также плохо, напротив.
Skill — это описанный в файле «навык» агента: что он умеет делать, с какими инструментами и по какому протоколу.
Skill описывается как отдельный модуль (файл) с frontmatter: название и описание, какие файлы/директории он использует, какие команды может вызывать (shell, git, тесты и т.п.).
Агент может: вызывать skill как подзадачу, передавать ему часть контекста (например, конкретный баг/файл), комбинировать несколько skills в одной сессии.
Версиях 2.x добавили: авто‑подхват изменений skills без рестарта (modify → сразу доступен), более чёткую спецификацию входов/выходов, чтобы агент мог выбирать правильный skill сам.
Интеграции с IDE Плагины для VS Code / JetBrains, где Claude Code получает доступ к открытым файлам, символам, структуре проекта, и ты можешь дёргать его прямо из редактора.
CLI‑интеграции Поддержка стандартных инструментов (git, npm, pytest, docker и т.п.), которые агент умеет вызывать как «встроенные tools» в рамках skill'ов.
HTTP / внешние сервисы В новых гайдах есть паттерны, как описывать «HTTP‑плагины» (REST API как tool), чтобы Claude Code мог, например, стучаться в CI/CD, issue‑tracker или документацию.
Anthropic в best practices подчёркивает: лучше заворачивать сложные вещи (CI, миграции БД, деплой) в отдельные явные skills/tools, а не давать агенту прямой root‑доступ ко всему подряд.
Это уже сам по себе AI-агент, дополняя его скиллами вы можете покрывать десятки, если не сотни задач. От автоматизации работы с кодом, отрабатывая задачи по кругу до победного конца. До личного ассистента, который может напоминать о задачах и болтать с вами.
Если интересно — напишите в комментариях, первым делом вам расскажу о чём-то из этого по Claude Code, прежде чем писать огромную статью по теме.
Но если быть более точными, то нас интересует LangGraph, который создан именно для AI-агентов. Граф состояний (узлы — шаги: LLM, tools, маршрутизация; рёбра — переходы), поддержка многосоставных агентов, параллельных вызовов tools, повторов, лимитов итераций.
LangChain часто используют для RAG/линейных chain'ов, а LangGraph — для сложных агентных сценариев.
Вся сложность в том, что в этом методе из коробки вайбкода нет, да и он может упереться в банальный потолок нейросетей. Тут уже требуется разработка. Мы пишем структуру, мы пишем код. Мы делаем всё сами.
У тебя всегда есть три вещи:
State — структура данных, которая живёт между шагами (обычно messages, иногда ещё scratchpad, tools_output, флаги и т.д.).
Nodes — функции, которые принимают state и возвращают обновлённый state (например, вызвать LLM, выполнить tool, переписать вопрос).
Edges — связи между узлами: обычные (последовательные) условные (router, решающий, куда дальше идти).
Обычно всё пишется на Python, TypeScript/JavaScript допустим. Безусловно, идём и обращаемся к документации, придётся освоить этот инструмент.
Наверное этот инструмент достоин целой серии статей, где мы погрузимся в саму разработку. Дайте знать, что вам интереснее из этого узнать в первую очередь.
Если после прочтения у вас остались сомнения, вы всё ещё испытываете скепсис и вообще ожидаете краха всей индустрии. Я вас понимаю, давайте поговорим прямо.
AI сегодня правда огромный пузырь, миллиардные инвестиции в новые проекты, продукты, архитектуры и железо. И это всё не окупает себя, эти компании не зарабатывают. AI‑пузырь вокруг агентов — это смесь завышенных ожиданий («ИИ‑сотрудник, который сам ведёт бизнес») и реальных ниш, где агенты уже тихо приносят пользу.
Нейросети — это инструмент, который способен ускорить вашу работу или расширить возможности. И ключевое слово это инструмент, которым вы должны уметь пользоваться и собирать под себя. А насколько инструмент полезный вопрос едва ли спорный, можно посмотреть список возможностей, что ассистенты на практике закрывают сегодня:
Вот хотя бы краткий список того, что сейчас люди внедряют к себе, просто для того, чтобы вас немного удивить и дать немного мотивации.
Закрывать рутину и «офисный труд»: разбирать почту, триажить тикеты, ставить задачи в таск‑трекер; заполнять CRM, обновлять статусы сделок, напоминать о дедлайнах.
Автоматизировать поддержку и FAQ: отвечать на типовые вопросы клиентов и сотрудников 24/7; собирать нужный контекст из RAG‑базы и эскалировать сложные кейсы человеку.
Делать ресёрч и аналитику: собирать данные с сайтов, соцсетей, форумов, API; агрегировать и резюмировать отчёты, новости, документацию.
Помогать в операциях и финансах: обрабатывать счета, заявки, формы, акты; отслеживать аномалии и фрод, подсвечивать рисковые транзакции.
Оптимизировать процессы и инфраструктуру: следить за логами, метриками, алертами (AIOps‑агенты); предсказывать поломки (predictive maintenance), подсказывать, когда обслужить оборудование.
Лично для человека: календарь и встречи, email‑ассистент, подготовка к созвонам; заметки, сводки дня, повторение задач и контекстов.
Спасибо за прочтение! Очень вам благодарна!
Источник


