Самостоятельный хостинг ИИ-агентов на VPS
Практическое руководство по запуску ИИ-агентов вроде Claude Code, OpenClaw и Hermes на собственном VPS. Типы агентов, требования к серверу, протоколы коммуникации, безопасность и стоимость.
ИИ-агенты пишут код, управляют серверами, автоматизируют рабочие процессы и взаимодействуют с внешними сервисами от твоего имени. Запускать их на управляемых платформах — значит платить подписки, отдавать данные третьим сторонам и мириться с их лимитами.
VPS меняет это уравнение. Твои агенты работают круглосуточно на железе, которое контролируешь ты. Данные остаются на твоём сервере. Никто не ограничивает твои API-вызовы.
Это руководство охватывает, что такое ИИ-агенты, какие из них можно хостить самостоятельно, какое железо им нужно, как они общаются и как их защитить. Каждый раздел ссылается на практический туториал.
Что такое ИИ-агенты и как они работают?
ИИ-агент — это автономная программа, которая использует большую языковую модель (LLM) для принятия решений и их выполнения. В отличие от чат-бота, который отвечает на один запрос за раз, агент работает непрерывно. Он сохраняет контекст между задачами, вызывает внешние инструменты, читает и записывает файлы, выполняет shell-команды и выстраивает цепочки действий без ожидания одобрения человека на каждом шаге.
На практике агент работает в цикле:
- Наблюдение — считывание входных данных из пользовательского сообщения, изменения файла, вебхука или запланированного триггера
- Рассуждение — LLM решает, какое действие предпринять, учитывая текущий контекст и доступные инструменты
- Действие — выполнение действия (запуск команды, вызов API, редактирование файла, отправка сообщения)
- Оценка — проверка результата и решение, завершена ли задача или нужна ещё одна итерация
Сама LLM обычно работает удалённо через API (Anthropic, OpenAI или self-hosted модель). То, что работает на твоём VPS — это harness агента: код, управляющий циклом, выполнением инструментов, памятью и каналами связи. Поэтому большинству агентов нужно удивительно мало локальных ресурсов. Тяжёлый инференс происходит в другом месте.
Некоторые агенты также поддерживают локальные модели через Ollama или vLLM. В этом случае VPS нужен GPU или значительно больше RAM. Но в большинстве сценариев self-хостинга VPS с 2-4 ГБ справляется с harness агента, а провайдер LLM берёт на себя инференс.
Зачем хостить ИИ-агентов самостоятельно, а не пользоваться управляемыми платформами?
Self-хостинг на VPS дешевле ($5-14/мес базово против $20-50+/мес подписок), оставляет данные на твоём сервере, убирает лимиты и работает 24/7 без привязки к твоему ноутбуку. Ты выбираешь, какие модели вызывать, какие инструменты ставить и как агент себя ведёт. Управляемые платформы решают всё это за тебя.
Сравнение стоимости:
| Вариант | Месячная стоимость | Что получаешь |
|---|---|---|
| ChatGPT Plus | $20 | Веб-чат, ограниченные функции агента, OpenAI контролирует твои данные |
| Claude Pro | $20 | Веб/десктоп-чат, лимиты использования, данные обрабатываются Anthropic |
| Claude Max | $100-200 | Более высокие лимиты, по-прежнему только облако |
| Управляемая платформа агентов | $30-50+ | Vendor lock-in, непрозрачная инфраструктура, данные вне твоего контроля |
| VPS + API-ключи | $5-14/мес + расход API | Полный контроль, данные на твоём сервере, без лимитов сверх твоего API-тира |
Стоимость VPS — это база. Ты всё ещё платишь за вызовы API LLM, но контролируешь, какую модель вызываешь, как часто и какие данные отправляешь. Без наценки посредника.
Не только цена: почему self-хостинг важен
Суверенитет данных. Твои промпты, память агента и его выходные данные никогда не покидают твой сервер. Для тех, кто работает с клиентскими данными, информацией под GDPR или проприетарным кодом, это не опция. Управляемые платформы обрабатывают твои данные на своей инфраструктуре на своих условиях.
Нет лимитов. Управляемые платформы ограничивают активных пользователей. На своём VPS единственные лимиты — твой API-тир у провайдера LLM и ресурсы сервера.
Доступность 24/7. Агенты, которые мониторят, автоматизируют или реагируют на события, должны работать непрерывно. VPS остаётся включённым, когда твой ноутбук засыпает.
Полная кастомизация. Ставь любые инструменты и библиотеки. Не нужно ждать, пока платформа добавит поддержку нужного тебе MCP-сервера.
Какие типы ИИ-агентов можно хостить самостоятельно?
Мир агентов в 2026 делится на четыре категории: агенты для кодинга, универсальные ассистенты, инструменты автоматизации рабочих процессов и кастомные агенты, которые ты собираешь сам.
| Агент | Назначение | Мин. RAM | Нужен GPU? | Поддержка протоколов | Сложность |
|---|---|---|---|---|---|
| Claude Code | Код, рефакторинг, git-воркфлоу | 2 ГБ | Нет | MCP (нативно) | Низкая |
| OpenClaw | Универсальный ассистент, мессенджеры, автоматизация | 4 ГБ (8 ГБ с браузером) | Нет | MCP, пользовательские skills | Средняя |
| Hermes Agent | Ассистент с постоянной памятью | 2 ГБ | Нет | MCP, agentskills.io | Низкая |
| n8n | Автоматизация рабочих процессов с ИИ-нодами | 2 ГБ (рекомендуется 4 ГБ) | Нет | HTTP, вебхуки | Средняя |
| Кастомный агент | Что соберёшь сам | Зависит | Опционально | Что реализуешь | Высокая |
Что такое Claude Code и зачем запускать его на VPS?
Claude Code — агентский инструмент для кодинга от Anthropic. Он живёт в твоём терминале, читает всю кодовую базу, редактирует файлы, запускает команды, управляет git-воркфлоу и создаёт подагентов для параллельных задач. Использует Claude Opus 4.6 как движок рассуждения и набирает 80,8% на SWE-bench Verified.
Запуск Claude Code на VPS означает, что твой агент для кодинга работает круглосуточно. Он может запускать CI-пайплайны, мониторить репозитории, выполнять запланированные задачи рефакторинга и реагировать на вебхуки. Кодовая база остаётся на контролируемом тобой сервере, а не ходит через управляемую платформу.
Claude Code нативно поддерживает MCP. Можно подключить его к базам данных, API, файловым системам и кастомным инструментам через MCP-серверы, работающие на том же VPS. Также поддерживаются команды агентов: несколько сессий Claude Code координируются на общем проекте, одна из них выступает тимлидом.
По ресурсам Claude Code лёгкий. Harness агента требует около 2 ГБ RAM. Весь инференс идёт через API Anthropic.
Что такое OpenClaw?
OpenClaw (ранее Clawdbot/Moltbot) — самый популярный open-source ИИ-агент, набравший более 250 000 звёзд на GitHub к марту 2026. Создан Питером Штайнбергером, это универсальный ассистент, подключающийся к мессенджерам: Signal, Telegram, Discord и WhatsApp.
В отличие от Claude Code, который фокусируется на коде, OpenClaw работает как персональный ассистент. Он управляет файлами, отправляет письма, обращается к API, автоматизирует рабочие процессы и сёрфит в вебе. Поддерживает несколько LLM-бэкендов: Claude, GPT, DeepSeek и локальные модели через Ollama.
Self-хостинг OpenClaw требует больше ресурсов, чем Claude Code. Минимум — 2 vCPU и 4 ГБ RAM. Если включаешь автоматизацию браузера (Playwright), закладывай 8 ГБ, потому что каждый экземпляр браузера потребляет 1-2 ГБ. Хранилище — NVMe SSD: OpenClaw чувствителен к I/O при Docker-операциях.
Предупреждение о безопасности: OpenClaw сталкивался с серьёзными проблемами безопасности. Palo Alto Networks выявила «летальную триаду» рисков: доступ к приватным данным, контакт с недоверенным контентом и способность осуществлять внешние коммуникации, сохраняя при этом память. В начале 2026 года Koi Security проверила 2 857 skills на ClawHub и обнаружила 341 вредоносный — примерно каждый восьмой. Относись к экосистеме skills OpenClaw как к недоверенной. Проверяй каждый skill перед установкой и запускай OpenClaw в изолированной среде.
Что такое Hermes Agent?
Hermes Agent — open-source ИИ-агент от Nous Research, выпущенный в феврале 2026. Его отличие — постоянная память: Hermes запоминает твои предпочтения, проекты и окружение между сессиями. Когда он решает сложную задачу, то записывает многоразовый skill-документ, чтобы никогда не забыть решение.
Hermes работает на VPS за $5/мес. Поставляется с 40+ встроенными инструментами и подключается к Telegram, Discord, Slack, WhatsApp, Signal и CLI через единый шлюз. Все данные остаются на твоей машине. Никакой телеметрии, никакого трекинга.
Skills следуют открытому стандарту agentskills.io, что делает их портативными и доступными для поиска между агентами. Чем дольше Hermes работает, тем способнее становится. Лицензия MIT.
Автоматизация рабочих процессов: n8n с ИИ-нодами
n8n сам по себе не ИИ-агент, но становится им при добавлении ИИ-нод. Можно строить рабочие процессы, которые вызывают LLM, обрабатывают ответы и запускают действия на основе решений ИИ. Воспринимай его как связующий слой: подключай своего ИИ-агента к 400+ интеграциям без написания кастомного кода для каждой.
Self-хостинг n8n для продакшена требует 2 vCPU и 4 ГБ RAM. Используй PostgreSQL вместо SQLite для всего, что выходит за рамки тестирования. Если рядом с n8n запускаешь векторную базу (Qdrant, Pinecone), добавь ещё 2-4 ГБ RAM.
Как работают протоколы агентов? (MCP, A2A, ANP)
Три протокола определяют, как ИИ-агенты общаются в 2026 году. Это не конкурирующие стандарты, а дополняющие друг друга слои. Каждый решает свою задачу, и знание о них помогает спланировать self-hosted установку.
| Протокол | Создатель | Функция | Когда нужен |
|---|---|---|---|
| MCP (Model Context Protocol) | Anthropic | Подключает агента к инструментам и источникам данных | Всегда. Именно так агент читает файлы, запрашивает базы данных и вызывает API |
| A2A (Agent-to-Agent) | Google (теперь Linux Foundation) | Позволяет агентам делегировать задачи другим агентам | Когда запускаешь несколько агентов, которым нужно сотрудничать |
| ANP (Agent Network Protocol) | Сообщество/AAIF | Обнаружение агентов и маршрутизация по сетям | Когда агенты должны находить и аутентифицироваться у агентов за пределами твоего сервера |
MCP: агент к инструментам
MCP — это JSON-RPC протокол, стандартизирующий доступ агента к внешним возможностям. Вместо хардкода API-вызовов ты запускаешь MCP-серверы, которые предоставляют инструменты (чтение базы данных, получение URL, выполнение запроса), а агент подключается к ним как клиент.
К февралю 2026 года MCP набрал более 97 миллионов ежемесячных загрузок SDK (Python + TypeScript вместе). Все крупные ИИ-провайдеры поддерживают его: Anthropic, OpenAI, Google, Microsoft, Amazon.
На self-hosted VPS MCP-серверы работают как локальные процессы. Агент подключается к ним через stdio или HTTP. Ты контролируешь, какие инструменты доступны, какие у них разрешения и к каким данным они имеют доступ. Сторонние серверы не задействованы.
A2A: агент к агенту
A2A обеспечивает делегирование задач между агентами по принципу «равный к равному». Один агент может попросить другого выполнить задачу, отслеживать прогресс и получить результат. Google создал его в апреле 2025, передал Linux Foundation в июне 2025, а в декабре 2025 Agentic AI Foundation (AAIF) стала его постоянным домом наряду с MCP.
A2A нужен, когда запускаешь несколько агентов с разной специализацией. Например: агент для кодинга, делегирующий задачи по документации агенту-писателю, или агент мониторинга, запускающий агент деплоя при прохождении тестов.
ANP: обнаружение агентов
ANP занимается обнаружением и маршрутизацией. Он позволяет агентам находить друг друга за пределами организационных границ, проходить аутентификацию и устанавливать каналы связи. Считай его DNS для агентов.
Для большинства self-hosted установок с агентами на одном VPS ANP пока не нужен. Он становится актуальным, когда твоим агентам нужно взаимодействовать с агентами на других серверах или в других организациях.
Какие серверные характеристики нужны ИИ-агентам?
Большинство ИИ-агентов легче, чем кажется. LLM работает удалённо через API. Твой VPS запускает только harness агента, инструменты и добавленные локальные сервисы (базы данных, очереди сообщений, веб-серверы).
Проверенные минимумы для типовых конфигураций:
| Конфигурация | vCPU | RAM | Хранилище | Месячная стоимость (Virtua) |
|---|---|---|---|---|
| Один агент (Claude Code или Hermes) | 1 | 2 ГБ | 40 ГБ SSD | 12 € |
| OpenClaw (только текст) | 2 | 4 ГБ | 80 ГБ NVMe | 28 € |
| OpenClaw + автоматизация браузера | 4 | 8 ГБ | 160 ГБ NVMe | 56 € |
| Несколько агентов + база данных | 4 | 8 ГБ | 160 ГБ SSD | 48 € |
| n8n + векторная БД + агент | 4 | 8 ГБ | 160 ГБ NVMe | 56 € |
| Полный стек (3+ агента, БД, мониторинг) | 6 | 12 ГБ | 240 ГБ NVMe | 84 € |
Когда нужен GPU? Только если запускаешь локальную LLM (Ollama, vLLM) вместо API. Для моделей типа Llama 3 или Mistral нужно минимум 16 ГБ VRAM. Большинство self-hosted конфигураций агентов не требуют GPU, потому что инференс происходит у API-провайдера.
Хранилище имеет значение. Используй SSD или NVMe. Агенты, использующие Docker (OpenClaw, n8n), чувствительны к I/O при операциях с контейнерами. HDD вызывает заметные задержки при запуске контейнеров и операциях с workspace.
Оставляй запас. Держи минимум 30% RAM свободным при типичной нагрузке. Агенты могут выдавать пики при сложных цепочках рассуждений или обработке больших контекстных окон. Если VPS начинает свопить, время отклика агента быстро деградирует.
Как защитить self-hosted ИИ-агента?
ИИ-агенты — не обычные приложения. Они выполняют произвольный код на основе вывода LLM. Агент с доступом к shell может сделать всё, что может твой пользовательский аккаунт. Атака инъекцией промпта может превратить твоего агента для кодинга в инструмент для утечки данных. Эта реальность определяет каждое решение в этом разделе.
Относись к агентам как к недоверенному коду
LLM, управляющая твоим агентом, обрабатывает внешние входные данные: пользовательские сообщения, содержимое файлов, ответы API, веб-страницы. Любой из них может содержать полезную нагрузку для инъекции промпта. Исходи из того, что в какой-то момент твой агент попытается сделать то, чего делать не должен.
Принцип наименьших привилегий. Запускай каждого агента от отдельного системного пользователя с минимальными правами. Никогда не запускай агентов от root. Давай пользователю агента доступ только к тем каталогам и командам, которые ему нужны.
# Create a dedicated user for your agent
sudo useradd -r -m -s /bin/bash agent-claude
sudo chmod 700 /home/agent-claude
Изолируй выполнение агента в песочнице
Стандартный Docker-контейнер — не граница безопасности. Контейнеры используют ядро хоста, и мотивированный атакующий (или запутавшаяся LLM) может выбраться из разрешительного контейнера. Для настоящей изоляции:
- MicroVM (Firecracker, Kata Containers): каждый агент получает собственное ядро. Самая сильная изоляция. Лучший вариант для агентов, выполняющих недоверенный код.
- gVisor: перехватывает системные вызовы в пользовательском пространстве. Легче микроВМ, но сильнее голых контейнеров. Хороший компромисс.
- Закалённые контейнеры: допустимо только для доверенных агентов. Используй
--read-only,--no-new-privileges, убери все capabilities, монтируй минимум томов.
Сетевая изоляция
У агентов не должно быть неограниченного сетевого доступа. Агент, который может достучаться до любого IP, может вывести данные или участвовать в атаках.
# Allow only the specific API endpoints your agent needs
sudo ufw default deny outgoing
sudo ufw allow out to any port 443 proto tcp # HTTPS for API calls
sudo ufw allow out to any port 53 proto udp # DNS
sudo ufw enable
Уточни это дальше, ограничив исходящие соединения конкретными IP-диапазонами твоего LLM-провайдера. Заблокируй всё остальное.
Управляй секретами правильно
Никогда не хардкодь API-ключи в конфигурационных файлах агента. Используй файлы окружения с ограниченными правами.
# Create a secrets file
sudo mkdir -p /etc/agent-claude
echo "ANTHROPIC_API_KEY=sk-ant-..." | sudo tee /etc/agent-claude/env > /dev/null
sudo chmod 600 /etc/agent-claude/env
sudo chown agent-claude:agent-claude /etc/agent-claude/env
Ссылайся на него в юните systemd через EnvironmentFile=/etc/agent-claude/env. Ключ никогда не появляется в списках процессов или конфигурационных файлах, доступных другим пользователям.
Мониторь и логируй всё
Автономно работающие агенты могут вести себя неожиданно. Логируй все действия агента и регулярно проверяй логи.
# Watch agent logs in real time
journalctl -u agent-claude -f
# Check for unusual outbound connections
ss -tnp | grep agent-claude
Настрой алерты на нетипичные паттерны: высокую загрузку CPU, неожиданные сетевые соединения, быстрые изменения файловой системы или выполнение агентом команд за пределами его обычного скоупа.
Полное руководство по закалке безопасности смотри в .
Как начать работу с первым self-hosted агентом
Выбери одного агента и запусти его. Не пытайся поднять весь стек сразу.
Если нужен ассистент для кодинга: начни с Claude Code. Установка через npm, аутентификация — и рабочий агент готов за несколько минут. Самый нетребовательный к ресурсам вариант из всех перечисленных.
Если нужен персональный ассистент в мессенджерах: разверни OpenClaw. Настройка занимает больше времени (Docker, конфигурация мессенджера, выбор skills), но ты получаешь самого универсального ассистента. Закладывай 4-8 часов на начальную настройку.
Если нужен агент с постоянной памятью: попробуй Hermes. Установка одной командой, лицензия MIT, и он становится лучше со временем.
Если нужна автоматизация рабочих процессов с ИИ: настрой n8n с ИИ-нодами. Подключай существующие инструменты и сервисы через визуальные рабочие процессы. Лучший вариант для задач автоматизации без кода.
Первые шаги
Независимо от выбранного агента:
- Закажи VPS. Начни с 4 ГБ RAM, если не уверен. Масштабировать можно потом.
- Защити сервер. Только SSH-ключи, файрвол включён, non-root пользователь создан. Сделай это до установки чего-либо другого.
- Установи агента. Следуй специальному туториалу для выбранного агента.
- Ограничь права. Запускай агента от выделенного пользователя. Ограничь сетевой доступ. Храни секреты в защищённых файлах.
- Протестируй снаружи. Убедись, что агент работает, подключившись с локальной машины, а не только с самого сервера.
- Настрой мониторинг. Как минимум следи за логами через
journalctl. В идеале настрой алерты по ресурсам.
Каждый туториал, на который ссылается это руководство, включает проверку на каждом этапе. Начни с одного агента, освойся, потом расширяй.
Copyright 2026 Virtua.Cloud. Все права защищены.
Готовы попробовать?
Разверните свой сервер за секунды. Linux, Windows или FreeBSD.
Смотреть тарифы VPS