第120章(第2/4页)

一旦开始频繁使用,各种花里胡哨的问题就会出现。

数据中心刚刚进入收钱收到手抽筋的状态,就不出意外的出意外了。

那一天的早上,天气很好,阳光灿烂,孩子们还在享受着快乐的暑假,孩子们还在享受着快乐的暑假,上班的人也处于正常的骂老板和不想上班的情绪里。

只有二十几个单位网站,几个论坛的管理员发现了异常。

那二十几个单位的网站里包括「吃了么」和「中国货」,还有紫金支付。

第一个发现问题的是小雪,今天是「预约午餐有好礼」活动的第一天,早上五点,小雪在家里打开电脑,想看看页面有没有正常显示。

万一好礼太诱人,客户太多导致页面崩溃的话,还要抓紧修复。

小雪高高兴兴地打开页面,发现页面打不开了。

整个都打不开了!

诶??生意这么好的吗?

她不是没有想过生意火爆,但是没想到能这么火爆。

就为了多送两个茶叶蛋,居然有这么多人早上五点起来预约午餐??

小雪一边困惑一边点击了「刷新」,页面依旧提示无法连接。

小雪赶紧打电话给运维。

运维此时已经在满头冒汗地处理了,他们查了一遍bug,没bug,又查了一遍数据。

在网页无法连接之前,也就一千多个人预约了早餐,还不如下大雨的饭点的访问量高。

“吃了么……”运维工程师的汗还没擦干净,就轮到数据中心的运维工程师头上冒汗了。

数据中心早就收到云间市的机房包间通道温控报警。

工程师急忙介入查询。

五分钟后,多个包间升温警报,眼看着事情越闹越大,一时半会儿按不下去,工程师们在召唤更多同伴的同时,也不得不把事情向上汇报。

正常情况下,由一线值守的运维处理就行,一线值守的运维搞不定的话,会有更高级的技术人员来处理。

短时间能搞定的事情,第一时间都不会想到通知行政管理上的人员,技术上的事情叫他们毫无意义。除了会站在旁边吱哇乱叫,增加紧张气氛之外,也没什么卵用。

然而,五点二十七分,睡得正香的安夏接到了王娇娇的电话:“安总,抱歉打扰,数据中心的机房出问题了。”

王娇娇已经尽量用了冷静平静的语气向安夏汇报。

不过她再冷静也没用,一件事情到了安夏这里,就说明这事已经非常严重了。

不管是用报丧的语气还是用报喜的语气说,都不会改变性质。

安夏被这个消息顿时吓醒了,一线运维工程师向她汇报那个数据中心涉及的单位。

除了紫金自家的,还有几个政府机关的网页,以及几个电业局的智能电表的数据也在这里面。

“容灾逃逸启动了吗?”安夏问道。

运维总负责人ꁘꁘ回答:“还没有。”

“你在等什么?!”安夏忍不住提高了声音。

□□马上回答:“是,马上切换机房!”

挂了电话以后,安夏一直在刷新网页,五分钟后,运维汇报:所有受到影响的网页已经全部恢复。

安夏看了一眼时间,刚刚到凌晨六点,从系统首次发现故障到现在共经历了一个小时,她这才稍稍松了一口气。

幸好这个受到影响的数据中心承接的都是普通业务。

要是像后世那样动不动就是个分钟级、秒级的业务,服务器从断气到机房转移完毕,中间不知道要赔几万几十万。

也幸好现在时间还早,大多数人还在梦乡之中。

要是紫金支付的客户发现他们的账户余额为零,或是半天刷不出来,怕不是当场就要提刀杀来了。

只要客户那里不炸,机房的事可以慢慢算。

通过这件事,安夏也发现一个问题,明明有备灾机房,□□却没想到马上开启容灾逃逸?他对自己这么自信?

真有这个本事的话,她应该收到的是故障说明,还有处理报告,而不是事情还没解决就到她这里。

安夏对数据中心的救灾演习非常不满,出现问题之后,运维根本就是在凭本能做事,心思都在解决故障上面,完全没想到最重要的是不要影响到客户。

一旦失去了客户的信任,以后数据中心的业务还做不做了。

安夏叫来负责系统安全的总监龙运,刚想问问他们有没有一套规范的应急手册,以及有没有演习过。