justhost Jtti TOTHost 恒创科技 华纳云 搬瓦工

记录一次 GigsGigsCloud 香港 VDS 因机房交换机故障宕机 9 小时的惨痛经历

ad

今天网站因为 GigsGigsCloud 机房交换机的问题宕机了近 9 个小时,从夜里 4 点左右到 13 点才恢复,并且还是因为找了 GigsGigsCloud 老板才有了提前恢复的特权。这里记录下这次宕机 9 小时的整个过程,以及以后应对这种潜在不稳定因素的可能解决方案。

一、宕机过程

背景:我有好几个网站是放在 GigsGigsCloud 香港 VDS 上的(查看方案介绍与测评),说实话,如果网络不抽风的话,香港 PCCW 线路还是很快的,配合 200Mbps 带宽,以及 VDS 独享资源的特性,放几个网站稳稳的。

宕机:今天早上 10 点左右的时候,看到 GigsGigsCloud 的 TG 频道发了一条消息说 GGC 香港机房的一个机柜的交换机出现故障,影响了部分的香港 VDS 和香港独服(消息),然后我就看了下自己的网站,事实证明我就是被影响的部分香港 VDS 中的一员,网站整个没响应了。

然后我就去百度统计看了下今天的访客记录,看看到底从什么时候开始宕机的,这是 便宜VPS网 今天(2019 年 7 月 26 日)的流量记录,从凌晨 3 点多开始就没有流量了,期间陆续几个访问基本可以忽略不记:

GigsGigsCloud 宕机

再对比下 2019 年 7 月 25 日的流量记录:

GigsGigsCloud 宕机

GigsGigsCloud 宕机

GigsGigsCloud 宕机

然后我又看了其他几个放在这台 VDS 上的网站,也是统一的凌晨 4 点就开始完全没访问记录了,所以基本可以断定从凌晨 4 点不到就开始宕机了。

二、宕机解决

不看不知道,一看吓一跳,4 点开始宕机,居然宕机了 6 个小时官方才发通告说出现了交换机故障,那么还需要宕机多久才能修复好呢?我就去 GigsGigsCloud 的官方 TG 群(@gigsgigscloudgroup)问了下老板,因为 GigsGigsCloud 家的 Ticket 是出了名的差,等客服回答你工单,可能都是下周了。这个时候是 10 点不到。

可能是老板忙于修交换机,只是说在修,我大概问了 3 次大概什么时候能修好,也没有给我明确答复。因为当时我身边也没有电脑,所以也转移不了网站,只能希望能快点把交换机换好,既然发现了问题,我想应该能很快修好然后重新工作吧。这个时候是 11 点左右。

然后我吃完饭回到办公室坐到电脑前,网站居然还是未响应。这个时候是 12 点。

于是我开始转移网站。因为有备份的习惯,所以所有网站数据都在别的服务器上有备份。但是因为我在这台 VDS 上放了好几个网站,所以转移还是费了点时间。在转移网站的过程中,我看到 GigsGigsCloud 发了新的通告,说部分 VDS 恢复了,然而这个部分不包括我的,这个时候是 12 点 36 分。

我又到 TG 群问了下,其他的 VDS 还需要多久能恢复?老板终于回我了,说还需要几小时大概。

没办法,我继续转移网站。12 点 47 的时候,老板 TG 上私聊我,问我的 IP,我把我的 IP 告诉他,然后12 点 56 分的时候网站恢复正常。

从 4 点开始宕机,一直到 13 点才恢复,差不多经历了 9 个小时。并且还是因为老板的特殊照顾我才有机会“提前”恢复,不然可能还要等几小时,但是这个几小时到底是几小时我就不知道了。

三、以后该怎么备份

9 个小时的宕机,说实话还是很降好感的,我之前还是比较喜欢 GigsGigsCloud 家的香港 VDS 的,毕竟这个价格是买不到这个配置 + 这个线路的香港服务器的。

说说对 GigsGigsCloud 的感受,老板在 TG 群里还是比较积极的,有问题基本都会回复,但是他家客服是真的差劲,工单 3-5 天回复一次,不私聊老板都不带给你处理的。然后他家的香港和新加坡的机器线路都不错,适合建站,但是经历过这次后,我搜了下他家的 SLA,但是似乎没有找到,并且,我宕机了 9 个小时,也是当作什么都没有发生罢了,补偿,不存在的。

那么,我以后还会用 GigsGigsCloud 的香港 VDS 吗?宕机这么久,没有补偿,没有 SLA 保障,但是我应该还是会继续使用,这个价格的香港 VDS,真香。

如果你追求更稳定的服务器,可以参考之前总结的香港 VPS 总结,例如搬瓦工的 SLA 都是写明了的,99.9% 的在线保障,就是说 1 个月大概只有不到 1 小时的时间线路可能出现问题,但实际上基本都不会出现问题,还有腾讯云和阿里云也是都写明了 SLA 的,宕机超过一定标准直接全额退款。

机房出现问题不是你能控制的,你能做的只能是做好备份,应对这次宕机经历,对于网站数据的保护,准备做好以下策略:

  1. 提高备份频率,重要的网站全部 1 天备份一次,这样保证能拿到的数据是最新的,而不是像这次我只有 4 天前的网站数据;
  2. 网站不能放在一个服务器上,就像鸡蛋不能放在一个篮子里一样,多买几台服务器吧,重要的网站分开放;
  3. 再买一台 VDS 或者其他家的香港 / 新加坡服务器,配置好 LNMP,哪一天出现问题了,直接向这台备用机器上传网站数据,导入数据库数据,修改域名解析记录,添加 vhost 记录,这样整个过程应该不会超过 15 分钟;
  4.  写一个监控脚本,每 1 小时尝试一次打开所有网站,如果不能打开,则发邮件通知我,不能像这次都宕机了 6 个小时了我都没发现;
  5. 负载均衡,主从配置,实时备份。不过这个在我的知识盲区,以后有时间研究下。
赞(0)
未经允许不得转载:便宜VPS网 » 记录一次 GigsGigsCloud 香港 VDS 因机房交换机故障宕机 9 小时的惨痛经历