Эти строки пришли на ум, когда я задумался о личном ассистенте. За 20 плюс с лишним лет опыта управления продуктовыми ИТ компаниями я никогда не имел личного ассистента. Не знаю, как так получилось, но мне всегда было проще самому создавать события в календаре или сортировать свою почту. Не то чтобы я этого не мог себе позволить, но так ни разу не делегировал часть своей рутины другому человеку. Тут, наверное, есть два варианта. Или я control freak или жадина, но мне приятнее думать, что первое :-)
В прошлом году я почувствовал, что время чудес пришло и я могу создать личного ассистента себе самостоятельно, без чьей-либо помощи. В этой статье я вам покажу наброски своего личного AI-ассистента и предложу вашему вниманию инструментарий, которые я использовал.
Итак, первое, с чего я начал, я освоил фреймворк N8N, который предоставляет отличную базу для написания своего AI-ассистента. N8N — это open-source инструмент для автоматизации рабочих процессов, который позволяет создавать сложные сценарии через визуальный интерфейс. Он работает по принципу drag-and-drop, поэтому кода практически не требуется за мелким исключением.
Для управления своим ассистентом я выбрал голосовое сообщение в Телеграме, создал своего персонального бота, что довольно просто, и через этого бота я управляю своим ассистентом. N8N слушает моего бота и разбирает мои голосовые команды с помощью механизмов транскрибации. Я использую для этого OpenAI, но чисто теоретически для этого подойдет любая другая LLM.
Когда транскрибация завершена, я пользуюсь специальным блоком AI-агент, который самостоятельно решает, какой же инструмент нужно применить для моей команды. Для моего примера я пока оставил всего лишь три варианта. Это транскрибация голосового сообщения в моем Obsidian, управление моим календарем, и задача сбора записей всех звонков за день опять-таки в Obsidian. Но в целом этот список можно расширять до бесконечности, и для этой статьи я остановлюсь на одном из самых важных пунктов.
Когда сообщение транскрибировано, я могу с помощью довольно простой операции выложить эту заметку к себе на Яндекс.Диск. Яндекс.Диск в свою очередь у меня синхронизирован с локальным Obsidian, и вуаля, я уже могу видеть свое голосовое сообщение, превращенное в текст. На минуточку. Скорость голосового ввода на порядок быстрее, чем печатание. Я владею техникой слепой печати как на русском и на английском языке, но, признаюсь, был приятно удивлен, какой прыжок производительности я совершил после того, как перешел на голосовой ввод.
Таким же образом я могу управлять своим календарем. Голосовая команда транскрибируется, AI-агент понимает намерение создать событие, извлекает дату, время и описание, и создает запись в календаре. Это работает настолько быстро, что я уже привык планировать встречи и задачи просто проговаривая их в Telegram-бот.
Еще один из примеров, который я готов показать, это суммаризация моих звонков, которые тоже попадают в мой Obsidian. Для этих целей я просто использую IMAP слушателя, который, получив письмо с транскриптом моей записи в Яндекс Телемосте, делает нехитрую операцию по выкладке этого транскрипта на Яндекс.Диск, который опять-таки синхронизирован с моим Obsidian. Таким образом, в своем локальном компьютере я автоматически получаю записи всех своих звонков, совершенных за день, и плюс суммаризация этих звонков. На этот раз я использовал Perplexity, хотя в целом OpenAI тоже мог бы подойти.
Я также решил для себя задачу пропущенных писем за день. Когда трудишься как генеральный директор, то очень часто бываешь "в полях" не за рабочим столом, а с телефона пропустить одно важное письмо среди сотни других чуть менее важных очень легко, да? Я нашел решение для себя. N8N постоянно мониторит мои письма и специальным промптом проверяет их на важность и срочность. И если такие находятся, раз в день (а можно сделать и мгновенно) я получаю напоминание в Telegram. Это позволило мне не пропускать критически важные сообщения, даже когда я весь день в разъездах или на встречах.
Как вы видите, каркас личного ассистента, собранный в связке N8N, API вызова LLM, таких как ChatGPT и Perplexity, плюс локальный Obsidian, дополненный синхронизацией с Яндекс.Диском штатными средствами, решает довольно серьезные задачи. Первое – голосовой ввод, скорость на порядок превышает текстовый ввод. Второе – управление личным календарем через голосовые команды. Третье – автоматическая сборка всех звонков за день в одном месте с суммаризацией. Четвертое – фильтрация важных писем с уведомлениями в Telegram, что особенно актуально для топ менеджеров.
Отдельно хочется отметить, что такой подход позволяет существенным образом увеличить личную производительность, но стоит сделать оговорку, что это, конечно же, больше автоматизация, чем ИИ-изация. ИИ в моих автоматизациях занимает, может быть, процентов 10-20, а основное – это простая, хорошо известная автоматизация. Многие не понимают разницы и все называют ИИ-автоматизацией. Зная это, я специально использовал ИИ в заголовке этой статьи для привлечения внимания :) Но, большинство рутинных операций могут быть автоматизированы и без использования ИИ, и фреймворк N8N (или его аналоги) с этим прекрасно справляется.
Я продолжаю расширять функционал своего ассистента. В планах добавить автоматическое создание задач на основе голосовых команд, интеграцию с различными системами управления, и возможно, более сложные сценарии, где ИИ действительно будет принимать решения на основе контекста моей работы.
Возвращаясь к цитате Высоцкого, теперь я чувствую себя многоруким Шивой. Каждая новая автоматизация — это новая "рука" моего ассистента, которая берет на себя часть задач. И я потихоньку добавляю руки своему ассистенту, расширяя его возможности.
А как у вас устроена автоматизация рутинных задач?
Используете ли вы голосовой ввод для повышения продуктивности?
Есть ли у вас личные автоматизации, которые существенно экономят время?
Какую роль в ваших автоматизациях играет ИИ?
Если тема интересна, подписывайтесь на мой телеграм-канал Мастер Данных, где я регулярно делюсь опытом внедрения ИИ для повышения личной продуктивности.
Источник


