ИИ-агенты на VPS: полное руководство по хостингу

ИИ-агенты пишут код, управляют серверами, автоматизируют рабочие процессы и взаимодействуют с внешними сервисами от твоего имени. Запускать их на управляемых платформах — значит платить подписки, отдавать данные третьим сторонам и мириться с их лимитами.

VPS меняет это уравнение. Твои агенты работают круглосуточно на железе, которое контролируешь ты. Данные остаются на твоём сервере. Никто не ограничивает твои API-вызовы.

Что такое ИИ-агенты и как они работают?

ИИ-агент — это автономная программа, которая использует большую языковую модель (LLM) для принятия решений и их выполнения. В отличие от чат-бота, который отвечает на один запрос за раз, агент работает непрерывно. Он сохраняет контекст между задачами, вызывает внешние инструменты, читает и записывает файлы, выполняет shell-команды и выстраивает цепочки действий без ожидания одобрения человека на каждом шаге.

На практике агент работает в цикле:

Наблюдение — считывание входных данных из пользовательского сообщения, изменения файла, вебхука или запланированного триггера
Рассуждение — LLM решает, какое действие предпринять, учитывая текущий контекст и доступные инструменты
Действие — выполнение действия (запуск команды, вызов API, редактирование файла, отправка сообщения)
Оценка — проверка результата и решение, завершена ли задача или нужна ещё одна итерация

Сама LLM обычно работает удалённо через API (Anthropic, OpenAI или self-hosted модель). То, что работает на твоём VPS — это harness агента: код, управляющий циклом, выполнением инструментов, памятью и каналами связи. Поэтому большинству агентов нужно удивительно мало локальных ресурсов. Тяжёлый инференс происходит в другом месте.

Некоторые агенты также поддерживают локальные модели через Ollama или vLLM. В этом случае VPS нужен GPU или значительно больше RAM. Но в большинстве сценариев self-хостинга VPS с 2-4 ГБ справляется с harness агента, а провайдер LLM берёт на себя инференс.

Зачем хостить ИИ-агентов самостоятельно, а не пользоваться управляемыми платформами?

Self-хостинг на VPS дешевле управляемых подписок, оставляет данные на твоём сервере, убирает лимиты и работает 24/7 без привязки к твоему ноутбуку. Ты выбираешь, какие модели вызывать, какие инструменты ставить и как агент себя ведёт. Управляемые платформы решают всё это за тебя.

Вариант	Модель ценообразования	Что получаешь
ChatGPT Plus	Фиксированная месячная подписка. См. цены OpenAI	Веб-чат, ограниченные функции агента, OpenAI контролирует твои данные
Claude Pro	Фиксированная месячная подписка. См. цены Anthropic	Веб/десктоп-чат, лимиты использования, данные обрабатываются Anthropic
Claude Max	Многоуровневая месячная подписка. См. цены Anthropic	Более высокие лимиты, по-прежнему только облако
Управляемая платформа агентов	Поюзерно или по потреблению, зависит от поставщика	Vendor lock-in, непрозрачная инфраструктура, данные вне твоего контроля
VPS + API-ключи	От 5 €/мес + оплата API по потреблению	Полный контроль, данные на твоём сервере, без лимитов сверх твоего API-тира

Ты всё ещё платишь за вызовы API LLM, но контролируешь, какую модель вызываешь, как часто и какие данные отправляешь. Без наценки посредника.

Не только цена: почему self-хостинг важен

Суверенитет данных. Твои промпты, память агента и его выходные данные никогда не покидают твой сервер. Для тех, кто работает с клиентскими данными, информацией под GDPR или проприетарным кодом, это не опция. Управляемые платформы обрабатывают твои данные на своей инфраструктуре на своих условиях. Защита сервера ИИ-агентов: песочница, файрвол и мониторинг

Нет лимитов. Управляемые платформы ограничивают активных пользователей. На своём VPS единственные лимиты — твой API-тир у провайдера LLM и ресурсы сервера.

Доступность 24/7. Агенты, которые мониторят, автоматизируют или реагируют на события, должны работать непрерывно. VPS остаётся включённым, когда твой ноутбук засыпает.

Полная кастомизация. Ставь любые инструменты и библиотеки. Не нужно ждать, пока платформа добавит поддержку нужного тебе MCP-сервера.

Какие типы ИИ-агентов можно хостить самостоятельно?

Мир агентов в 2026 делится на четыре категории: агенты для кодинга, универсальные ассистенты, инструменты автоматизации рабочих процессов и кастомные агенты, которые ты собираешь сам.

Агент	Назначение	Мин. RAM	Нужен GPU?	Поддержка протоколов	Сложность
Claude Code	Код, рефакторинг, git-воркфлоу	2 ГБ	Нет	MCP (нативно)	Низкая
OpenClaw	Универсальный ассистент, мессенджеры, автоматизация	4 ГБ (8 ГБ с браузером)	Нет	MCP, пользовательские skills	Средняя
Hermes Agent	Ассистент с постоянной памятью	2 ГБ	Нет	MCP, agentskills.io	Низкая
n8n	Автоматизация рабочих процессов с ИИ-нодами	2 ГБ (рекомендуется 4 ГБ)	Нет	HTTP, вебхуки	Средняя
Кастомный агент	Что соберёшь сам	Зависит	Опционально	Что реализуешь	Высокая

Что такое Claude Code и зачем запускать его на VPS?

Claude Code — агентский инструмент для кодинга от Anthropic. Он живёт в твоём терминале, читает всю кодовую базу, редактирует файлы, запускает команды, управляет git-воркфлоу и создаёт подагентов для параллельных задач. Использует Claude Opus 4.6 как движок рассуждения и набирает 80,8% на SWE-bench Verified.

Запуск Claude Code на VPS означает, что твой агент для кодинга работает круглосуточно. Он может запускать CI-пайплайны, мониторить репозитории, выполнять запланированные задачи рефакторинга и реагировать на вебхуки. Кодовая база остаётся на контролируемом тобой сервере, а не ходит через управляемую платформу.

Claude Code нативно поддерживает MCP. Можно подключить его к базам данных, API, файловым системам и кастомным инструментам через MCP-серверы, работающие на том же VPS. Также поддерживаются команды агентов: несколько сессий Claude Code координируются на общем проекте, одна из них выступает тимлидом.

По ресурсам Claude Code лёгкий. Harness агента требует около 2 ГБ RAM. Весь инференс идёт через API Anthropic.

Что такое OpenClaw?

OpenClaw (ранее Clawdbot/Moltbot) — самый популярный open-source ИИ-агент, набравший более 250 000 звёзд на GitHub к марту 2026. Создан Питером Штайнбергером, это универсальный ассистент, подключающийся к мессенджерам: Signal, Telegram, Discord и WhatsApp.

В отличие от Claude Code, который фокусируется на коде, OpenClaw работает как персональный ассистент. Он управляет файлами, отправляет письма, обращается к API, автоматизирует рабочие процессы и сёрфит в вебе. Поддерживаемые LLM-бэкенды: Claude, GPT, DeepSeek и локальные модели через Ollama.

Self-хостинг OpenClaw требует больше ресурсов, чем Claude Code. Минимум — 2 vCPU и 4 ГБ RAM. Если включаешь автоматизацию браузера (Playwright), закладывай 8 ГБ, потому что каждый экземпляр браузера потребляет 1-2 ГБ. Хранилище — NVMe SSD: OpenClaw чувствителен к I/O при Docker-операциях.

Предупреждение о безопасности: OpenClaw сталкивался с серьёзными проблемами безопасности. Palo Alto Networks выявила «летальную триаду» рисков: доступ к приватным данным, контакт с недоверенным контентом и способность осуществлять внешние коммуникации, сохраняя при этом память. В начале 2026 года Koi Security проверила 2 857 skills на ClawHub и обнаружила 341 вредоносный — примерно каждый восьмой. Относись к экосистеме skills OpenClaw как к недоверенной. Проверяй каждый skill перед установкой и запускай OpenClaw в изолированной среде. Безопасный деплой OpenClaw на VPS

Что такое Hermes Agent?

Hermes Agent — open-source ИИ-агент от Nous Research, выпущенный в феврале 2026. Его отличие — постоянная память: Hermes запоминает твои предпочтения, проекты и окружение между сессиями. Когда он решает сложную задачу, то записывает многоразовый skill-документ, чтобы никогда не забыть решение.

Hermes работает на VPS за €5/мес. Поставляется с 40+ встроенными инструментами и подключается к Telegram, Discord, Slack, WhatsApp, Signal и CLI через единый шлюз. Все данные остаются на твоей машине. Никакой телеметрии, никакого трекинга.

Skills следуют открытому стандарту agentskills.io, что делает их портативными и доступными для поиска между агентами. Чем дольше Hermes работает, тем способнее становится. Лицензия MIT. Самостоятельный хостинг Hermes Agent на VPS

Автоматизация рабочих процессов: n8n с ИИ-нодами

n8n сам по себе не ИИ-агент, но становится им при добавлении ИИ-нод. Можно строить рабочие процессы, которые вызывают LLM, обрабатывают ответы и запускают действия на основе решений ИИ. Воспринимай его как связующий слой: подключай своего ИИ-агента к 400+ интеграциям без написания кастомного кода для каждой.

Self-хостинг n8n для продакшена требует 2 vCPU и 4 ГБ RAM. Используй PostgreSQL вместо SQLite для всего, что выходит за рамки тестирования. Если рядом с n8n запускаешь векторную базу (Qdrant, Pinecone), добавь ещё 2-4 ГБ RAM.

Как работают протоколы агентов? (MCP, A2A, ANP)

Три протокола определяют, как ИИ-агенты общаются в 2026 году. Это не конкурирующие стандарты, а дополняющие друг друга слои. Каждый решает свою задачу, и знание о них помогает спланировать self-hosted установку.

Протокол	Создатель	Функция	Когда нужен
MCP (Model Context Protocol)	Anthropic	Подключает агента к инструментам и источникам данных	Всегда. Именно так агент читает файлы, запрашивает базы данных и вызывает API
A2A (Agent-to-Agent)	Google (теперь Linux Foundation)	Позволяет агентам делегировать задачи другим агентам	Когда запускаешь несколько агентов, которым нужно сотрудничать
ANP (Agent Network Protocol)	Сообщество/AAIF	Обнаружение агентов и маршрутизация по сетям	Когда агенты должны находить и аутентифицироваться у агентов за пределами твоего сервера

MCP: агент к инструментам

MCP — это JSON-RPC протокол, стандартизирующий доступ агента к внешним возможностям. Вместо хардкода API-вызовов ты запускаешь MCP-серверы, которые предоставляют инструменты (чтение базы данных, получение URL, выполнение запроса), а агент подключается к ним как клиент.

К февралю 2026 года MCP набрал более 97 миллионов ежемесячных загрузок SDK (Python + TypeScript вместе). Все крупные ИИ-провайдеры поддерживают его: Anthropic, OpenAI, Google, Microsoft, Amazon.

На self-hosted VPS MCP-серверы работают как локальные процессы. Агент подключается к ним через stdio или HTTP. Ты контролируешь, какие инструменты доступны, какие у них разрешения и к каким данным они имеют доступ. Сторонние серверы не задействованы. Создание и самостоятельный хостинг MCP-сервера на VPS

A2A: агент к агенту

A2A обеспечивает делегирование задач между агентами по принципу «равный к равному». Один агент может попросить другого выполнить задачу, отслеживать прогресс и получить результат. Google создал его в апреле 2025, передал Linux Foundation в июне 2025, а в декабре 2025 Agentic AI Foundation (AAIF) стала его постоянным домом наряду с MCP.

A2A нужен, когда запускаешь несколько агентов с разной специализацией. Например: агент для кодинга, делегирующий задачи по документации агенту-писателю, или агент мониторинга, запускающий агент деплоя при прохождении тестов.

ANP: обнаружение агентов

ANP занимается обнаружением и маршрутизацией. Он позволяет агентам находить друг друга за пределами организационных границ, проходить аутентификацию и устанавливать каналы связи. Считай его DNS для агентов.

Для большинства self-hosted установок с агентами на одном VPS ANP пока не нужен. Он становится актуальным, когда твоим агентам нужно взаимодействовать с агентами на других серверах или в других организациях.

Какие серверные характеристики нужны ИИ-агентам?

Твой VPS запускает harness агента, инструменты и добавленные локальные сервисы (базы данных, очереди сообщений, веб-серверы). LLM работает удалённо.

Конфигурация	vCPU	RAM	Хранилище	Месячная стоимость (Virtua)
Один агент (Claude Code или Hermes)	1	2 ГБ	40 ГБ SSD	12 €
OpenClaw (только текст)	2	4 ГБ	80 ГБ NVMe	28 €
OpenClaw + автоматизация браузера	4	8 ГБ	160 ГБ NVMe	56 €
Несколько агентов + база данных	4	8 ГБ	160 ГБ SSD	48 €
n8n + векторная БД + агент	4	8 ГБ	160 ГБ NVMe	56 €
Полный стек (3+ агента, БД, мониторинг)	6	12 ГБ	240 ГБ NVMe	84 €

Когда нужен GPU? Только если запускаешь локальную LLM (Ollama, vLLM) вместо API. Для моделей типа Llama 3 или Mistral нужно минимум 16 ГБ VRAM. Большинство self-hosted конфигураций агентов не требуют GPU, потому что инференс происходит у API-провайдера.

Хранилище имеет значение. Используй SSD или NVMe. Агенты, использующие Docker (OpenClaw, n8n), чувствительны к I/O при операциях с контейнерами. HDD вызывает заметные задержки при запуске контейнеров и операциях с workspace.

Оставляй запас. Держи минимум 30% RAM свободным при типичной нагрузке. Агенты могут выдавать пики при сложных цепочках рассуждений или обработке больших контекстных окон. Если VPS начинает свопить, время отклика агента быстро деградирует.

Как защитить self-hosted ИИ-агента?

ИИ-агенты — не обычные приложения. Они выполняют произвольный код на основе вывода LLM. Агент с доступом к shell может сделать всё, что может твой пользовательский аккаунт. Атака инъекцией промпта может превратить твоего агента для кодинга в инструмент для утечки данных. Эта реальность определяет каждое решение в этом разделе.

Относись к агентам как к недоверенному коду

LLM, управляющая твоим агентом, обрабатывает внешние входные данные: пользовательские сообщения, содержимое файлов, ответы API, веб-страницы. Любой из них может содержать полезную нагрузку для инъекции промпта. Исходи из того, что в какой-то момент твой агент попытается сделать то, чего делать не должен.

Принцип наименьших привилегий. Запускай каждого агента от отдельного системного пользователя с минимальными правами. Никогда не запускай агентов от root. Давай пользователю агента доступ только к тем каталогам и командам, которые ему нужны.

# Create a dedicated user for your agent
sudo useradd -r -m -s /bin/bash agent-claude
sudo chmod 700 /home/agent-claude

Изолируй выполнение агента в песочнице

Стандартный Docker-контейнер — не граница безопасности. Контейнеры используют ядро хоста, и мотивированный атакующий (или запутавшаяся LLM) может выбраться из разрешительного контейнера. Для настоящей изоляции:

MicroVM (Firecracker, Kata Containers): каждый агент получает собственное ядро. Самая сильная изоляция. Лучший вариант для агентов, выполняющих недоверенный код.
gVisor: перехватывает системные вызовы в пользовательском пространстве. Легче микроВМ, но сильнее голых контейнеров. Хороший компромисс.
Закалённые контейнеры: допустимо только для доверенных агентов. Используй --read-only, --no-new-privileges, убери все capabilities, монтируй минимум томов.

Сетевая изоляция

У агентов не должно быть неограниченного сетевого доступа. Агент, который может достучаться до любого IP, может вывести данные или участвовать в атаках.

# Allow only the specific API endpoints your agent needs
sudo ufw default deny outgoing
sudo ufw allow out to any port 443 proto tcp  # HTTPS for API calls
sudo ufw allow out to any port 53 proto udp   # DNS
sudo ufw enable

Уточни это дальше, ограничив исходящие соединения конкретными IP-диапазонами твоего LLM-провайдера. Заблокируй всё остальное.

Управляй секретами правильно

Никогда не хардкодь API-ключи в конфигурационных файлах агента. Используй файлы окружения с ограниченными правами.

# Create a secrets file
sudo mkdir -p /etc/agent-claude
echo "ANTHROPIC_API_KEY=sk-ant-..." | sudo tee /etc/agent-claude/env > /dev/null
sudo chmod 600 /etc/agent-claude/env
sudo chown agent-claude:agent-claude /etc/agent-claude/env

Ссылайся на него в юните systemd через EnvironmentFile=/etc/agent-claude/env. Ключ никогда не появляется в списках процессов или конфигурационных файлах, доступных другим пользователям.

Мониторь и логируй всё

Автономно работающие агенты могут вести себя неожиданно. Логируй все действия агента и регулярно проверяй логи.

# Watch agent logs in real time
journalctl -u agent-claude -f

# Check for unusual outbound connections
ss -tnp | grep agent-claude

Настрой алерты на нетипичные паттерны: высокую загрузку CPU, неожиданные сетевые соединения, быстрые изменения файловой системы или выполнение агентом команд за пределами его обычного скоупа.

Полное руководство по закалке безопасности смотри в Защита сервера ИИ-агентов: песочница, файрвол и мониторинг.

Как начать работу с первым self-hosted агентом

Выбери одного агента и запусти его. Не пытайся поднять весь стек сразу.

Если нужен ассистент для кодинга: начни с Claude Code. Установка через npm, аутентификация — и рабочий агент готов за несколько минут. Самый нетребовательный к ресурсам вариант из всех перечисленных.

Если нужен персональный ассистент в мессенджерах: разверни OpenClaw. Настройка занимает больше времени (Docker, конфигурация мессенджера, выбор skills), но ты получаешь самого универсального ассистента. Закладывай 4-8 часов на начальную настройку. Безопасный деплой OpenClaw на VPS

Если нужен агент с постоянной памятью: попробуй Hermes. Установка одной командой, лицензия MIT, и он становится лучше со временем. Самостоятельный хостинг Hermes Agent на VPS

Если нужна автоматизация рабочих процессов с ИИ: настрой n8n с ИИ-нодами. Подключай существующие инструменты и сервисы через визуальные рабочие процессы. Лучший вариант для задач автоматизации без кода.

Первые шаги

Независимо от выбранного агента:

Закажи VPS. Начни с 4 ГБ RAM, если не уверен. Масштабировать можно потом.
Защити сервер. Только SSH-ключи, файрвол включён, non-root пользователь создан. Сделай это до установки чего-либо другого.
Установи агента. Следуй специальному туториалу для выбранного агента.
Ограничь права. Запускай агента от выделенного пользователя. Ограничь сетевой доступ. Храни секреты в защищённых файлах.
Протестируй снаружи. Убедись, что агент работает, подключившись с локальной машины, а не только с самого сервера.
Настрой мониторинг. Как минимум следи за логами через journalctl. В идеале настрой алерты по ресурсам.

Каждый туториал, на который ссылается это руководство, включает проверку на каждом этапе.

Самостоятельный хостинг ИИ-агентов на VPS