Самостоятельный хостинг ИИ-агентов на VPS
Практическое руководство по запуску ИИ-агентов вроде Claude Code, OpenClaw и Hermes на собственном VPS. Типы агентов, требования к серверу, протоколы коммуникации, безопасность и стоимость.
ИИ-агенты пишут код, управляют серверами, автоматизируют рабочие процессы и взаимодействуют с внешними сервисами от твоего имени. Запускать их на управляемых платформах — значит платить подписки, отдавать данные третьим сторонам и мириться с их лимитами.
VPS меняет это уравнение. Твои агенты работают круглосуточно на железе, которое контролируешь ты. Данные остаются на твоём сервере. Никто не ограничивает твои API-вызовы.
Что такое ИИ-агенты и как они работают?
ИИ-агент — это автономная программа, которая использует большую языковую модель (LLM) для принятия решений и их выполнения. В отличие от чат-бота, который отвечает на один запрос за раз, агент работает непрерывно. Он сохраняет контекст между задачами, вызывает внешние инструменты, читает и записывает файлы, выполняет shell-команды и выстраивает цепочки действий без ожидания одобрения человека на каждом шаге.
На практике агент работает в цикле:
- Наблюдение — считывание входных данных из пользовательского сообщения, изменения файла, вебхука или запланированного триггера
- Рассуждение — LLM решает, какое действие предпринять, учитывая текущий контекст и доступные инструменты
- Действие — выполнение действия (запуск команды, вызов API, редактирование файла, отправка сообщения)
- Оценка — проверка результата и решение, завершена ли задача или нужна ещё одна итерация
Сама LLM обычно работает удалённо через API (Anthropic, OpenAI или self-hosted модель). То, что работает на твоём VPS — это harness агента: код, управляющий циклом, выполнением инструментов, памятью и каналами связи. Поэтому большинству агентов нужно удивительно мало локальных ресурсов. Тяжёлый инференс происходит в другом месте.
Некоторые агенты также поддерживают локальные модели через Ollama или vLLM. В этом случае VPS нужен GPU или значительно больше RAM. Но в большинстве сценариев self-хостинга VPS с 2-4 ГБ справляется с harness агента, а провайдер LLM берёт на себя инференс.
Зачем хостить ИИ-агентов самостоятельно, а не пользоваться управляемыми платформами?
Self-хостинг на VPS дешевле управляемых подписок, оставляет данные на твоём сервере, убирает лимиты и работает 24/7 без привязки к твоему ноутбуку. Ты выбираешь, какие модели вызывать, какие инструменты ставить и как агент себя ведёт. Управляемые платформы решают всё это за тебя.
| Вариант | Модель ценообразования | Что получаешь |
|---|---|---|
| ChatGPT Plus | Фиксированная месячная подписка. См. цены OpenAI | Веб-чат, ограниченные функции агента, OpenAI контролирует твои данные |
| Claude Pro | Фиксированная месячная подписка. См. цены Anthropic | Веб/десктоп-чат, лимиты использования, данные обрабатываются Anthropic |
| Claude Max | Многоуровневая месячная подписка. См. цены Anthropic | Более высокие лимиты, по-прежнему только облако |
| Управляемая платформа агентов | Поюзерно или по потреблению, зависит от поставщика | Vendor lock-in, непрозрачная инфраструктура, данные вне твоего контроля |
| VPS + API-ключи | От 5 €/мес + оплата API по потреблению | Полный контроль, данные на твоём сервере, без лимитов сверх твоего API-тира |
Ты всё ещё платишь за вызовы API LLM, но контролируешь, какую модель вызываешь, как часто и какие данные отправляешь. Без наценки посредника.
Не только цена: почему self-хостинг важен
Суверенитет данных. Твои промпты, память агента и его выходные данные никогда не покидают твой сервер. Для тех, кто работает с клиентскими данными, информацией под GDPR или проприетарным кодом, это не опция. Управляемые платформы обрабатывают твои данные на своей инфраструктуре на своих условиях. Защита сервера ИИ-агентов: песочница, файрвол и мониторинг
Нет лимитов. Управляемые платформы ограничивают активных пользователей. На своём VPS единственные лимиты — твой API-тир у провайдера LLM и ресурсы сервера.
Доступность 24/7. Агенты, которые мониторят, автоматизируют или реагируют на события, должны работать непрерывно. VPS остаётся включённым, когда твой ноутбук засыпает.
Полная кастомизация. Ставь любые инструменты и библиотеки. Не нужно ждать, пока платформа добавит поддержку нужного тебе MCP-сервера.
Какие типы ИИ-агентов можно хостить самостоятельно?
Мир агентов в 2026 делится на четыре категории: агенты для кодинга, универсальные ассистенты, инструменты автоматизации рабочих процессов и кастомные агенты, которые ты собираешь сам.
| Агент | Назначение | Мин. RAM | Нужен GPU? | Поддержка протоколов | Сложность |
|---|---|---|---|---|---|
| Claude Code | Код, рефакторинг, git-воркфлоу | 2 ГБ | Нет | MCP (нативно) | Низкая |
| OpenClaw | Универсальный ассистент, мессенджеры, автоматизация | 4 ГБ (8 ГБ с браузером) | Нет | MCP, пользовательские skills | Средняя |
| Hermes Agent | Ассистент с постоянной памятью | 2 ГБ | Нет | MCP, agentskills.io | Низкая |
| n8n | Автоматизация рабочих процессов с ИИ-нодами | 2 ГБ (рекомендуется 4 ГБ) | Нет | HTTP, вебхуки | Средняя |
| Кастомный агент | Что соберёшь сам | Зависит | Опционально | Что реализуешь | Высокая |
Что такое Claude Code и зачем запускать его на VPS?
Claude Code — агентский инструмент для кодинга от Anthropic. Он живёт в твоём терминале, читает всю кодовую базу, редактирует файлы, запускает команды, управляет git-воркфлоу и создаёт подагентов для параллельных задач. Использует Claude Opus 4.6 как движок рассуждения и набирает 80,8% на SWE-bench Verified.
Запуск Claude Code на VPS означает, что твой агент для кодинга работает круглосуточно. Он может запускать CI-пайплайны, мониторить репозитории, выполнять запланированные задачи рефакторинга и реагировать на вебхуки. Кодовая база остаётся на контролируемом тобой сервере, а не ходит через управляемую платформу.
Claude Code нативно поддерживает MCP. Можно подключить его к базам данных, API, файловым системам и кастомным инструментам через MCP-серверы, работающие на том же VPS. Также поддерживаются команды агентов: несколько сессий Claude Code координируются на общем проекте, одна из них выступает тимлидом.
По ресурсам Claude Code лёгкий. Harness агента требует около 2 ГБ RAM. Весь инференс идёт через API Anthropic.
Что такое OpenClaw?
OpenClaw (ранее Clawdbot/Moltbot) — самый популярный open-source ИИ-агент, набравший более 250 000 звёзд на GitHub к марту 2026. Создан Питером Штайнбергером, это универсальный ассистент, подключающийся к мессенджерам: Signal, Telegram, Discord и WhatsApp.
В отличие от Claude Code, который фокусируется на коде, OpenClaw работает как персональный ассистент. Он управляет файлами, отправляет письма, обращается к API, автоматизирует рабочие процессы и сёрфит в вебе. Поддерживаемые LLM-бэкенды: Claude, GPT, DeepSeek и локальные модели через Ollama.
Self-хостинг OpenClaw требует больше ресурсов, чем Claude Code. Минимум — 2 vCPU и 4 ГБ RAM. Если включаешь автоматизацию браузера (Playwright), закладывай 8 ГБ, потому что каждый экземпляр браузера потребляет 1-2 ГБ. Хранилище — NVMe SSD: OpenClaw чувствителен к I/O при Docker-операциях.
Предупреждение о безопасности: OpenClaw сталкивался с серьёзными проблемами безопасности. Palo Alto Networks выявила «летальную триаду» рисков: доступ к приватным данным, контакт с недоверенным контентом и способность осуществлять внешние коммуникации, сохраняя при этом память. В начале 2026 года Koi Security проверила 2 857 skills на ClawHub и обнаружила 341 вредоносный — примерно каждый восьмой. Относись к экосистеме skills OpenClaw как к недоверенной. Проверяй каждый skill перед установкой и запускай OpenClaw в изолированной среде. Безопасный деплой OpenClaw на VPS
Что такое Hermes Agent?
Hermes Agent — open-source ИИ-агент от Nous Research, выпущенный в феврале 2026. Его отличие — постоянная память: Hermes запоминает твои предпочтения, проекты и окружение между сессиями. Когда он решает сложную задачу, то записывает многоразовый skill-документ, чтобы никогда не забыть решение.
Hermes работает на VPS за €5/мес. Поставляется с 40+ встроенными инструментами и подключается к Telegram, Discord, Slack, WhatsApp, Signal и CLI через единый шлюз. Все данные остаются на твоей машине. Никакой телеметрии, никакого трекинга.
Skills следуют открытому стандарту agentskills.io, что делает их портативными и доступными для поиска между агентами. Чем дольше Hermes работает, тем способнее становится. Лицензия MIT. Самостоятельный хостинг Hermes Agent на VPS
Автоматизация рабочих процессов: n8n с ИИ-нодами
n8n сам по себе не ИИ-агент, но становится им при добавлении ИИ-нод. Можно строить рабочие процессы, которые вызывают LLM, обрабатывают ответы и запускают действия на основе решений ИИ. Воспринимай его как связующий слой: подключай своего ИИ-агента к 400+ интеграциям без написания кастомного кода для каждой.
Self-хостинг n8n для продакшена требует 2 vCPU и 4 ГБ RAM. Используй PostgreSQL вместо SQLite для всего, что выходит за рамки тестирования. Если рядом с n8n запускаешь векторную базу (Qdrant, Pinecone), добавь ещё 2-4 ГБ RAM.
Как работают протоколы агентов? (MCP, A2A, ANP)
Три протокола определяют, как ИИ-агенты общаются в 2026 году. Это не конкурирующие стандарты, а дополняющие друг друга слои. Каждый решает свою задачу, и знание о них помогает спланировать self-hosted установку.
| Протокол | Создатель | Функция | Когда нужен |
|---|---|---|---|
| MCP (Model Context Protocol) | Anthropic | Подключает агента к инструментам и источникам данных | Всегда. Именно так агент читает файлы, запрашивает базы данных и вызывает API |
| A2A (Agent-to-Agent) | Google (теперь Linux Foundation) | Позволяет агентам делегировать задачи другим агентам | Когда запускаешь несколько агентов, которым нужно сотрудничать |
| ANP (Agent Network Protocol) | Сообщество/AAIF | Обнаружение агентов и маршрутизация по сетям | Когда агенты должны находить и аутентифицироваться у агентов за пределами твоего сервера |
MCP: агент к инструментам
MCP — это JSON-RPC протокол, стандартизирующий доступ агента к внешним возможностям. Вместо хардкода API-вызовов ты запускаешь MCP-серверы, которые предоставляют инструменты (чтение базы данных, получение URL, выполнение запроса), а агент подключается к ним как клиент.
К февралю 2026 года MCP набрал более 97 миллионов ежемесячных загрузок SDK (Python + TypeScript вместе). Все крупные ИИ-провайдеры поддерживают его: Anthropic, OpenAI, Google, Microsoft, Amazon.
На self-hosted VPS MCP-серверы работают как локальные процессы. Агент подключается к ним через stdio или HTTP. Ты контролируешь, какие инструменты доступны, какие у них разрешения и к каким данным они имеют доступ. Сторонние серверы не задействованы. Создание и самостоятельный хостинг MCP-сервера на VPS
A2A: агент к агенту
A2A обеспечивает делегирование задач между агентами по принципу «равный к равному». Один агент может попросить другого выполнить задачу, отслеживать прогресс и получить результат. Google создал его в апреле 2025, передал Linux Foundation в июне 2025, а в декабре 2025 Agentic AI Foundation (AAIF) стала его постоянным домом наряду с MCP.
A2A нужен, когда запускаешь несколько агентов с разной специализацией. Например: агент для кодинга, делегирующий задачи по документации агенту-писателю, или агент мониторинга, запускающий агент деплоя при прохождении тестов.
ANP: обнаружение агентов
ANP занимается обнаружением и маршрутизацией. Он позволяет агентам находить друг друга за пределами организационных границ, проходить аутентификацию и устанавливать каналы связи. Считай его DNS для агентов.
Для большинства self-hosted установок с агентами на одном VPS ANP пока не нужен. Он становится актуальным, когда твоим агентам нужно взаимодействовать с агентами на других серверах или в других организациях.
Какие серверные характеристики нужны ИИ-агентам?
Твой VPS запускает harness агента, инструменты и добавленные локальные сервисы (базы данных, очереди сообщений, веб-серверы). LLM работает удалённо.
| Конфигурация | vCPU | RAM | Хранилище | Месячная стоимость (Virtua) |
|---|---|---|---|---|
| Один агент (Claude Code или Hermes) | 1 | 2 ГБ | 40 ГБ SSD | 12 € |
| OpenClaw (только текст) | 2 | 4 ГБ | 80 ГБ NVMe | 28 € |
| OpenClaw + автоматизация браузера | 4 | 8 ГБ | 160 ГБ NVMe | 56 € |
| Несколько агентов + база данных | 4 | 8 ГБ | 160 ГБ SSD | 48 € |
| n8n + векторная БД + агент | 4 | 8 ГБ | 160 ГБ NVMe | 56 € |
| Полный стек (3+ агента, БД, мониторинг) | 6 | 12 ГБ | 240 ГБ NVMe | 84 € |
Когда нужен GPU? Только если запускаешь локальную LLM (Ollama, vLLM) вместо API. Для моделей типа Llama 3 или Mistral нужно минимум 16 ГБ VRAM. Большинство self-hosted конфигураций агентов не требуют GPU, потому что инференс происходит у API-провайдера.
Хранилище имеет значение. Используй SSD или NVMe. Агенты, использующие Docker (OpenClaw, n8n), чувствительны к I/O при операциях с контейнерами. HDD вызывает заметные задержки при запуске контейнеров и операциях с workspace.
Оставляй запас. Держи минимум 30% RAM свободным при типичной нагрузке. Агенты могут выдавать пики при сложных цепочках рассуждений или обработке больших контекстных окон. Если VPS начинает свопить, время отклика агента быстро деградирует.
Как защитить self-hosted ИИ-агента?
ИИ-агенты — не обычные приложения. Они выполняют произвольный код на основе вывода LLM. Агент с доступом к shell может сделать всё, что может твой пользовательский аккаунт. Атака инъекцией промпта может превратить твоего агента для кодинга в инструмент для утечки данных. Эта реальность определяет каждое решение в этом разделе.
Относись к агентам как к недоверенному коду
LLM, управляющая твоим агентом, обрабатывает внешние входные данные: пользовательские сообщения, содержимое файлов, ответы API, веб-страницы. Любой из них может содержать полезную нагрузку для инъекции промпта. Исходи из того, что в какой-то момент твой агент попытается сделать то, чего делать не должен.
Принцип наименьших привилегий. Запускай каждого агента от отдельного системного пользователя с минимальными правами. Никогда не запускай агентов от root. Давай пользователю агента доступ только к тем каталогам и командам, которые ему нужны.
# Create a dedicated user for your agent
sudo useradd -r -m -s /bin/bash agent-claude
sudo chmod 700 /home/agent-claude
Изолируй выполнение агента в песочнице
Стандартный Docker-контейнер — не граница безопасности. Контейнеры используют ядро хоста, и мотивированный атакующий (или запутавшаяся LLM) может выбраться из разрешительного контейнера. Для настоящей изоляции:
- MicroVM (Firecracker, Kata Containers): каждый агент получает собственное ядро. Самая сильная изоляция. Лучший вариант для агентов, выполняющих недоверенный код.
- gVisor: перехватывает системные вызовы в пользовательском пространстве. Легче микроВМ, но сильнее голых контейнеров. Хороший компромисс.
- Закалённые контейнеры: допустимо только для доверенных агентов. Используй
--read-only,--no-new-privileges, убери все capabilities, монтируй минимум томов.
Сетевая изоляция
У агентов не должно быть неограниченного сетевого доступа. Агент, который может достучаться до любого IP, может вывести данные или участвовать в атаках.
# Allow only the specific API endpoints your agent needs
sudo ufw default deny outgoing
sudo ufw allow out to any port 443 proto tcp # HTTPS for API calls
sudo ufw allow out to any port 53 proto udp # DNS
sudo ufw enable
Уточни это дальше, ограничив исходящие соединения конкретными IP-диапазонами твоего LLM-провайдера. Заблокируй всё остальное.
Управляй секретами правильно
Никогда не хардкодь API-ключи в конфигурационных файлах агента. Используй файлы окружения с ограниченными правами.
# Create a secrets file
sudo mkdir -p /etc/agent-claude
echo "ANTHROPIC_API_KEY=sk-ant-..." | sudo tee /etc/agent-claude/env > /dev/null
sudo chmod 600 /etc/agent-claude/env
sudo chown agent-claude:agent-claude /etc/agent-claude/env
Ссылайся на него в юните systemd через EnvironmentFile=/etc/agent-claude/env. Ключ никогда не появляется в списках процессов или конфигурационных файлах, доступных другим пользователям.
Мониторь и логируй всё
Автономно работающие агенты могут вести себя неожиданно. Логируй все действия агента и регулярно проверяй логи.
# Watch agent logs in real time
journalctl -u agent-claude -f
# Check for unusual outbound connections
ss -tnp | grep agent-claude
Настрой алерты на нетипичные паттерны: высокую загрузку CPU, неожиданные сетевые соединения, быстрые изменения файловой системы или выполнение агентом команд за пределами его обычного скоупа.
Полное руководство по закалке безопасности смотри в Защита сервера ИИ-агентов: песочница, файрвол и мониторинг.
Как начать работу с первым self-hosted агентом
Выбери одного агента и запусти его. Не пытайся поднять весь стек сразу.
Если нужен ассистент для кодинга: начни с Claude Code. Установка через npm, аутентификация — и рабочий агент готов за несколько минут. Самый нетребовательный к ресурсам вариант из всех перечисленных.
Если нужен персональный ассистент в мессенджерах: разверни OpenClaw. Настройка занимает больше времени (Docker, конфигурация мессенджера, выбор skills), но ты получаешь самого универсального ассистента. Закладывай 4-8 часов на начальную настройку. Безопасный деплой OpenClaw на VPS
Если нужен агент с постоянной памятью: попробуй Hermes. Установка одной командой, лицензия MIT, и он становится лучше со временем. Самостоятельный хостинг Hermes Agent на VPS
Если нужна автоматизация рабочих процессов с ИИ: настрой n8n с ИИ-нодами. Подключай существующие инструменты и сервисы через визуальные рабочие процессы. Лучший вариант для задач автоматизации без кода.
Первые шаги
Независимо от выбранного агента:
- Закажи VPS. Начни с 4 ГБ RAM, если не уверен. Масштабировать можно потом.
- Защити сервер. Только SSH-ключи, файрвол включён, non-root пользователь создан. Сделай это до установки чего-либо другого.
- Установи агента. Следуй специальному туториалу для выбранного агента.
- Ограничь права. Запускай агента от выделенного пользователя. Ограничь сетевой доступ. Храни секреты в защищённых файлах.
- Протестируй снаружи. Убедись, что агент работает, подключившись с локальной машины, а не только с самого сервера.
- Настрой мониторинг. Как минимум следи за логами через
journalctl. В идеале настрой алерты по ресурсам.
Каждый туториал, на который ссылается это руководство, включает проверку на каждом этапе.
Готовы попробовать?
Запускайте ИИ-агентов на собственном VPS. →