2025年12月15日
你的网站即将崩溃的5个迹象
泰坦尼克号并非瞬间沉没。首先是撞击,然后是货舱进水,最后才是——灾难。你的网站也是一样。在崩溃很久之前,它就在“大声”呼救。你知道如何解读这些信号吗?
检查清单:即将死亡的症状
🔴 CRITICAL WARNINGS:
[WARN] TTFB rose to 800ms (avg: 120ms)
[WARN] DB Connections: 98/100 used
[ERR] Out of Memory: Kill process 'postgres'
[ERR] 502 Bad Gateway (Rate > 2%)
*如果你在日志中看到这个——请致电 NineLab。
1. TTFB 增长 (Time to First Byte)
如果服务器在给出第一个字节之前思考超过 200 毫秒——这是第一个警钟。这意味着代码或数据库已经在极限工作。
2. 数据库中的“连接太多” (Too many connections)
每个 SQL 请求都需要一个连接。如果池已满,新用户只会得到一个错误。这是一个经典的扩展问题。
3. 磁盘交换 (Swap)
最可怕的迹象。当 RAM 用完时,服务器开始使用硬盘作为一个内存。磁盘比 RAM 慢 100,000 倍。网站瞬间变成了南瓜。
4. 5xx 错误的增加
通过每天一个 500 错误是偶然的。每小时十个错误是一种模式。总流量的 1% 错误是一场火灾。
5. 日志沉默 (Log Silence)
听起来很奇怪,但如果日志突然停止写入,也许你只是磁盘空间用完了。这是“无声的死亡”。
建议: 在 Zabbix 或 Prometheus 中配置警报。在你的用户写愤怒的推文之前了解问题。