15 декабря 2025Евгений · Senior Systems Engineer

5 признаков, что ваш сайт скоро упадет


Титаник не утонул мгновенно. Сначала был удар, потом вода в трюмах, и только потом — катастрофа. С вашим сайтом то же самое. Он "кричит" о помощи задолго до того, как упасть. Умеете ли вы читать эти сигналы?

Чек-лист: Симптомы скорой смерти

🔴 CRITICAL WARNINGS:
[WARN] TTFB rose to 800ms (avg: 120ms)
[WARN] DB Connections: 98/100 used
[ERR] Out of Memory: Kill process 'postgres'
[ERR] 502 Bad Gateway (Rate > 2%)

*Если вы видите это в логах — звоните в NineLab.

1. Рост TTFB (Time to First Byte)

Если сервер думает дольше 200мс перед тем, как отдать первый байт — это первый звонок. Это значит, что код или база данных уже работают на пределе.

2. "Too many connections" в базе

Каждый SQL-запрос требует соединения. Если пул забит, новые пользователи просто получают ошибку. Это классическая проблема масштабирования.

3. Swap (Свопинг) диска

Самый страшный признак. Когда заканчивается оперативная память (RAM), сервер начинает использовать жесткий диск как память. Диск в 100 000 раз медленнее RAM. Сайт превращается в тыкву мгновенно.

4. Рост ошибок 5xx

Одна ошибка 500 в день — случайность. Десять ошибок в час — закономерность. 1% ошибок от общего трафика — это пожар.

5. Тишина в логах (Log Silence)

Звучит странно, но если логи резко перестали писаться, возможно, у вас просто кончилось место на диске. Это "тихая смерть".

Совет: Настройте алерты в Zabbix или Prometheus. Узнавайте о проблемах раньше, чем ваши пользователи напишут гневный твит.

Частые вопросы по теме

Фокус на инженерных метриках и стеке: API, БД, CDN и код — не только на текстах и мета-тегах.

Желательны метрики и логи; для БД часто достаточно read-only или стенда с репликой данных.

Оба: лаборатория даёт воспроизводимость, RUM — реальные устройства и сети; вместе они объясняют расхождения.

Приоритизировать по impact/effort, закрепить метрики «после» и повторить замер; тяжёлые правки можно вынести в отдельный этап.

Хотите применить это на практике?

Расскажите про вашу систему — предложим план работ и метрики, которые имеет смысл зафиксировать в SLA/SLO.

Все материалы: Аудит и тестирование

Аудит и тестирование28 декабря 2025 г.
Как провести стресс-тест сайта?

Стресс- и нагрузочное тестирование перед распродажами и рекламными пиками: сценарии, метрики, типичные узкие места и как встроить проверки в регулярный цикл разработки.

Читать статью