Groot glasvezelonderhoud in het Intermax core-netwerk: hoe gaan we daar mee om?

23 juni 2021
Intermax redactie

Deze blog werd geschreven door Niels Ardts, Lead Cloud Architect bij Intermax

Bij Intermax snappen we dat een optimale beschikbaarheid van uw IT-omgeving essentieel is voor uw bedrijfsvoering. Om die beschikbaarheid hoog te houden, is de aanwezige redundantie – oftewel het meervoudig uitvoeren van bijvoorbeeld een verbinding of systeem - binnen ons netwerk van het grootste belang. Daarom proberen we altijd te bedenken hoe we die redundantie kunnen verbeteren. Zo ook laatst, voor een - ogenschijnlijk standaard - onderhoud op een dark fiber glasvezelverbinding in de buurt van ons datacenter in Delft. In deze blog vertel ik waarom juist dit onderhoud zo mooi illustreert hoe wij bij Intermax denken over beschikbaarheid en redundantie.

Voor dit specifieke onderhoud moest één van onze leveranciers - op verzoek van de lokale gemeente - een kabel fysiek verplaatsen. Hierbij wordt als eerste de kabel doorgeknipt en vervolgens wordt de fysieke verplaatsing uitgevoerd. Als laatste wordt alles dan weer netjes aan elkaar gelast. Op zich niets bijzonders, we hebben regelmatig te maken met dit soort onderhoud – en daar merkt u niets van. Toch was dit een ongebruikelijk geval.

Om toe te lichten waarom dit onderhoud toch ongebruikelijk was, geef ik graag eerst wat achtergrondinformatie. De Intermax-omgeving is opgesplitst in verschillende silo's. Deze gebruiken over het algemeen dezelfde “onderlaag”; verschillende silo's gebruiken bijvoorbeeld dezelfde datacenters en ten dele ook dezelfde glasvezelroutes. Alle infrastructuur die we daar bovenop in de silo's gebruiken, splitsen we. Hierdoor heeft iedere silo bijvoorbeeld een eigen netwerk inclusief firewalls, eigen virtualisatienodes, en eigen storage – zoals te zien in onderstaand plaatje:

Terug naar het onderhoud. Dit onderhoud vond plaats op een route waar we in de architectuur van onze omgeving veelvuldig gebruik van maken, waardoor er in elke silo uitval van verbindingen zou ontstaan. Het onderhoud zou dus potentieel veel ellende op kunnen leveren, in het onverhoopte geval dat zaken niet als gepland zouden gaan.

Nu testen we de uitval van verbindingen regelmatig en hebben we er alle vertrouwen in dat onze omgevingen werken zoals bedacht. Toch liggen onverwachte situaties altijd op de loer. Wat bijvoorbeeld als er toevallig een storing op een andere lijn plaats zou vinden, gelijktijdig met het onderhoud? Reden om met ons eigen core-team een goede brainstorm te houden over preventieve maatregelen bij dit soort onderhoud. Die brainstorm leverde de volgende maatregelen op:

  • In verschillende silo's hebben we een extra kruislingse verbinding tussen Delft en Rotterdam opgezet, in geval van nood. Zo blijven we redundant, zelfs bij het uitvallen van een verbinding.
  • In de Intermax silo hebben we twee verbindingen naar Amsterdam preventief uitgezet zodat we zelf meer controle zouden hebben over het up- en down gaan van de verbindingen.
  • In de silo voor onze kantooromgeving hebben we een verbinding preventief uitgezet, zodat het onderhoud geen directe invloed kon hebben op de beschikbaarheid van de omgeving.
  • In de silo voor onze kantooromgeving hebben we het versturen van onze 2-factor pushberichten standaard geforceerd over een niet-Intermax verbinding, zodat de afhankelijkheid van het Intermax netwerk werd verminderd. Een dergelijke omschakeling zou op zich ook al automatisch plaatsvinden, maar door dit proactief op deze manier in te regelen zijn we 100% zeker dat dit altijd en direct zou functioneren.

Met deze en nog een aantal andere maatregelen gingen we met vertrouwen het onderhoud in. Alles ging volgens het boekje! Waren alle extra maatregelen dan onnodig? Ik vind van niet. Deze gang van zaken onderschrijft hoe belangrijk we bij Intermax het te allen tijde beschikbaar houden van onze omgevingen vinden. Met deze extra noodverbindingen hebben we een mooie stap gezet om, ook in geval van onderhoud, onze redundantie in de omgeving te behouden. Daar ben ik heel trots op!