Der Betrieb und die Verwaltung von kritischen Infrastrukturen (z.B. Rechenzentren, ob eigenes RZ, Colocation oder Micro-Sites) ist eine äußerst anspruchsvolle und komplexe Aufgabe, die oft unterschätzt wird. Die Komplexität heutiger kritischer Infrastrukturen wird selten ganzheitlich verstanden, vor allem dann nicht, wenn sie an der Auslastungsgrenze betrieben werden. Selbst in zertifizierten Rechenzentren kann es zu ungeplanten Ausfallzeiten kommen, die auf schlechte Planung, Betrieb, Wartung und Verwaltung zurückzuführen sind.
Der Kurs Certified Data Centre Facilities & Operations Manager ist ein dreitägiger Kurs, der dem Teilnehmer ermöglicht, vertiefte Kenntnisse über den Betrieb und die Verwaltung eines RZ zu erwerben. Dabei erstreckt sich der Lehrpfad von der Planung über die Überwachung und Wartung bis zum Reporting. Der Teilnehmer lernt die Komplexität des Betriebs einer geschäftskritischen Infrastruktur in überschaubare und systematische Prozesse zu gliedern.
Die Themenbereiche basieren nicht nur auf internationalen Standards, sondern zeigen anhand von Best Practices erfahrener Rechenzentrumsexperten auf, wo sich Fallstricke befinden und was bei Schnittstellen der Gewerke besonders zu beachten ist. Der CDFOM® ist ein Intensivkurs mit der Vermittlung von sehr viel Know-How, die den Teilnehmern einen enormen Mehrwert bringen und sie in die Lage versetzen, den Betrieb ihres Rechenzentrums zu verbessern.
Agenda
Das Betriebsteam des Rechenzentrums
- Führungskriterien und -attribute
- Wie man eine effiziente und effektive Teamstruktur für das IT- und Gebäude Management aufbaut
- Ein RZ-Team durch Definition von Rollen, Verantwortlichkeiten und Qualifikationen anhand einer Matrix führen
- „Key Performance Objectives (KPO -Leistungsvorgaben / Leistungsziele) und Beurteilungen
- Job-Rotation, Vergütung, Beförderung. Strategien zur Förderung und Bindung von Nachwuchs- und Führungskräften
- Training und Assessments (Bewertungen)
- Schichtmanagement und Dienstplanerstellung
Lieferantenmanagement
- Lieferantenauswahl und -qualifizierung
- Risikomanagement und Umgang mit Verstößen, Haftung, Rechts-, Eskalations- und Beschwerdeverfahren
- Grundlegende Überlegungen zu einer Lieferantenvereinbarung
- Leistungsmessung und Reporting (Berichtswesen)
Anlagenwartung
- Wartungsoptionen
- Konzeption zu Wartungsverträgen
- Konzeption und Entscheidungshilfe zwischen umfassenden / nicht umfassenden Instandhaltungskonzepten
- Garantie und Gewährleistung
- Serviceberichte, Abgleich mit Wartungsverträgen
- Wartungsgesichtspunkte, Gewichtung
- Vorbeugende, vorausschauende, zustands- und zuverlässigkeitsorientierte (RCM – zuverlässigkeitsorientierte Wartungen) Instandhaltung
- Verwaltung und Lagerung von Ersatzteilen vor Ort
Verwaltung von Sicherheits- und gesetzlichen Anforderungen
- Gesetzliche und branchenspezifische Konformität / Regelungen
- Notfallmaßnahmen und Sicherheitsrichtlinien und -verfahren
- PTW (Permit To Work – Genehmigung zur Durchführung von Tätigkeiten) Anforderungen und Verfahren
- Allgemeine Regeln und Vorschriften für das Rechenzentrum
- Ergonomischer Arbeitsbereich
- SOP’s (Standard Operating Procedure) für Stromausfall, Feuer, Bombendrohung usw.
Service Level Agreement (SLA)-Management
- Definition der Designbeschränkungen für Rechenzentren
- Definition von Messkriterien und Berichterstattung
- Abstimmung des Business SLA (Service-Level-Agreement) mit dem Lieferanten SLA
- Definition eines Chancenmanagementverfahrens für die Installation und Deinstallation neuer Geräte
- Berichtswesen und Eskalationsmanagement
Verwaltung der physischen Sicherheit
- Richtlinien aus Normen; ANSI/TIA-942, ISO/IEC- 27001/02, SS507
- SOP (Standard Operating Procedures) bei der Verwaltung der täglichen Sicherheitszugangskontrolle, wie z.B.;
- Ein- / Ausgangskontrolle und Zutrittsmanagement
- Permit-To-Work (PTW) und laufende genehmigte vereinbarte Tätigkeiten
- Warenlieferung
- Kundenzugang
- Effektive Patrouillenführung und 24x7 Wachsamkeit
- Umgang mit externen Bedrohungen; Krisen-/Notfallsituationen
- Management von Sicherheitsvorfällen
Kapazitäten-Management
- Definition der Designgrenzen des Rechenzentrums
- Festlegung von Schwellenwerten, Überwachung und Berichterstattung
- Überprüfung der Installationsprozesse und zukünftige Kapazitätsplanung
- Technische Lösungen zur Unterstützung der Kapazitätsplanung wie Computational Fluid Dynamics (CFD), Kapazitäts- und Konfigurationsmanagementlösungen
Management der Verkabelung
- Überblick über die ANSI/TIA-942, ANSI/TIA-606 Anforderungen
- Kabelspezifikation & Kennzeichnung auf Basis von ANSI/TIA-606
- Strom- und Netzwerkkabel im Rack
- Kennzeichnungsanforderungen
- Dokumentation der Verkabelung / Kabelrinnenauslegung
Reinigung und Schädlingsbekämpfung im Rechenzentrum
- Arten von Verschmutzungen in Rechenzentren wie H2S (Schwefelwasserstoff), Luftpartikel, Staubpartikel, usw.
- Häufige Ursachen von Verschmutzungen im Rechenzentrum
- Normen, Richtlinien und Techniken zur Reduzierung und Reinigung von Staub, Schädlingen und anderen Verschmutzungen und Störungen
Überwachung und Automatisierung von Rechenzentren
- Anforderungen an die Überwachung von Rechenzentren
- Schwellenwertvorgaben und Meldepflicht
- Benachrichtigungs- und Eskalationsanforderungen
- Automatisierte 24-Stunden-„Helpdesk-Ticketing-Systeme“
- Kundenbeschwerdemanagement & Change Management
- Anforderungen an die Leistungsmessung und -überwachung wie Kraftstoff- (für die Netzersatzanlagen) und Wasserverbrauch, PUE/DCiE etc.
Verwaltung von Dokumentationen/Archiven
- Normen für das Dokumentenmanagement
- Anforderungen an den Dokumentenmanagement-Prozess
- Mindest- und Wunschdokumentation
- Dokumente zur Betriebsführung
Anlagen-Lebenszyklus-Management
- Richtlinien und Verfahren für das Lebenszyklusmanagement
- Anlagenverwaltung einschließlich Software und Firmware
- Wartungssituationen
- Überprüfung, Auslöser und Berichterstattung
- Testszenario und -zyklus
Es ist empfehlenswert, dass die Teilnehmer über Erfahrung im Betrieb von Rechenzentren verfügen, obwohl dies nicht erforderlich ist. Bisherige Absolventen empfehlen, vor dem Besuch des CDFOM®-Kurses den CDCP®-Kurs zu besuchen.
- Kurssprache: Deutsch
- Schulungsunterlagen: Englisch
- Prüfungssprache: Deutsch oder Englisch
Zielgruppe
Die primäre Zielgruppe für diesen Kurs sind Fach- und Führungskräfte aus den Bereichen Gebäude und IT-Technik, die in und um das Rechenzentrum herum arbeiten und die Verantwortung dafür trägen, eine sichere und hohe Verfügbarkeit, Wartung und Verwaltung des RZ‘s zu erreichen.
Lernziele
Nach Abschluss des Kurses sind die Teilnehmer in der Lage:
- Durchführen einer Bedarfsanalyse zur Umsetzung von Geschäftsanforderungen in Rechenzentrumsdienste
- Rekrutieren und Verwalten des RZ-Betriebsteams
- Implementierung und Überwachung von Sicherheits- und Schutzmaßnahmen
- Aufbau eines geeigneten Wartungsprogrammes für die Rechenzentrumseinrichtung
- Auswahl der geeigneten Richtlinien und Prozesse, die für den Betrieb von Rechenzentren erforderlich sind
- Überwachung der Verfügbarkeit, Kapazität und Leistungs-fähigkeit des Rechenzentrums
- Verwaltung und Durchführung grundlegender Rechenzentrumsprojekte
- Einrichtung und Umsetzung eines Programms für ökologische Nachhaltigkeit
- Risiken im Rechenzentrum erkennen um frühzeitig darauf zu reagieren
- Auswahl und Verwaltung von Lieferanten und Messung ihrer Leistung