ga('set', 'anonymizeIp', 1);
Categories: 运维

OVH断电事故

据悉,约北京时间2017年11月9号下午3点钟,法国最大的IDC之一,OVH位于Strasbourg的SBG机房停电了。本博客与图床站均位于SBG1机房,都受到了此次事故波及。所幸自上次被服务商误删服务器后对图床站和图片存储进行了分离,并且图片和数据库都有2份备份,已上传的图片外链并没有受到影响。

事件记录:

官方目前仅告诉记者是停电导致的网络中断,并未解释具体原因,也没有说来电时间。


------------------更新------------1
此次停电事故预计将影响超过来自30个国家的客户,最多会有2000台服务器收到影响。

其中收到影响最大的为一家以色列的网商。(此处存疑)
据悉,今天是以色列最大的购物节日,但是由于OVH机房断电导致无法开展任何线上交易。

------------------更新------------2
据悉,此次受影响的是SBG1和SBG4两个机房,主要是由于法国电力集团(Electricite De France,EDF)供电失败(原因未知),随后机房启用两台备用发电机,但是启动失败。最终导致了机房断电。

------------------更新------------3
OVH总裁Octave Klaba表示,除了SBG机房断电外,他也担心通过POP链接的RBX和GRA两个机房可能会出现相比于SBG,规模更大的网络问题。

------------------更新------------4
此次事故是两条20KV的长距离输电线坏了,此后机房两台A+B的发电机是供电失败。可能总共涉及到SBG1,2,4一共三个机房。

------------------更新------------5
接刚收到的信息,由于此前的POP问题,目前欧洲的100G线路已经出现问题,RBX SBG GRA ERI LIM全部无**常工作,目前P19 WAW BHS机房已经上线。

------------------更新------------6
目前从RBX 通向TH2, GSW, LDN, BRU, FRA, AMS机房的线路全部出现问题,官方表示正在重启发电机。

------------------更新------------7
法国配电公司(ERDF)已经全面接手法国电力集团(EDF)的供电任务,OVH正在尝试恢复机房供电。

------------------更新------------8
OVH现任CEO Octave Klaba目前任然没有答复记者具体的机房恢复时间。也拒绝任何涉及此次赔偿的提问。

------------------更新------------9
OVH现任CEO Octave Klaba表示:
SBG机房已经通过发电机开始正常供电,但法国配电公司(ERDF)任然没有解决问题,预计15分钟内即可上线。
RBX机房数据库出现故障,目前机房所有的网络都无**常使用,OVH正在调用备份数据,预计30分钟内修复。

------------------更新------------10
法国配电公司(ERDF)已经修复好了一条20KV供电线,所有的发电机已经正常启动。POP修复工作已经在持续进行。
SBG2机房将在15-20分钟内上线,SBG1/SBG4将在1-2小时内上线。
有网友辣评,This is what I pay for?

------------------更新------------11
OVH表示正在重启SBG1/SBG4的服务器,同时已有两条路由线路开始了正常工作。
RBX已正常稳定工作。

------------------更新------------12
目前SBG所有机房已经正常,正在检查此前受到影响的服务器和客户。OVH已经暗示将开始赔偿事宜。

------------------更新------------13
CEO Octave Klaba发出声明信和事故说明
1.此次事故由两个独立的事件在独立的时间导致的,分别为SBG供电失败以及RBX数据交换错误,但是两者不具有关联性。
2.SBG是电力供应失败导致的,使得SBG的三个在用机房和另外一个在建机房断电,目前已经恢复了供电。但并非所有服务器都正常工作,可能需要最长4个小时来排查。事故从巴黎时间7:15到11:15共计4个小时。
3.RBX是由于内联交换系统出现了问题导致了包括连接到巴黎、富兰克林、阿姆斯特丹、伦敦和布鲁塞尔在内的所有的机房时出现数据交换困难。事件起因应该是软件bug,目前已经保证了RBX的正常运行,但具体bug还需时间去解决。事故从巴黎时间8:15到10:37共计2小时22分钟。

------------------更新------------14
截止到法国时间2017年11月9号,下午5点53分,目前任然有:
2100台独立服务器
1500台实例PCI设备
25000台VPS
300虚拟主机
无**常使用。据悉,已有大量用户发起抗议,并且部分现有用户已经迁移到AWS上。

------------------更新------------15
CEO Octave Klaba发出正式的道歉信,就此结束。

madlaxcb

Recent Posts

PVE7/PVE8 LXC容器开启TUN/TAP

今天打算用IPV6的LXC开启…

4月 ago

解决WIN10显示器重启后分辨率变低窗口乱跳问题

  最近换了显示器,当有事离开…

8月 ago

宝塔开启堡塔防入侵会导致Chevereto的Cron运行失败

昨晚给服务器搬迁,新服务器装了…

1年 ago

chevereto V3和V4的改造

今天有空升级了cheveret…

1年 ago