Rechenzentrum

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Dieser Artikel beschreibt Anlagen zum Betrieb von EDV-Rechentechnik. Zu der deutschen Band siehe Rechenzentrum (Band).
Rechenzentrum im CERN
Server im Rechenzentrum von CERN

Mit Rechenzentrum bezeichnet man sowohl das Gebäude bzw. die Räumlichkeiten, in denen die zentrale Rechentechnik (z. B. Rechner, aber auch die zum Betrieb notwendige Infrastruktur) einer oder mehrerer Unternehmen bzw. Organisationen untergebracht ist, als auch die Organisation selbst, die sich um diese Computer kümmert. Ihr kommt damit eine zentrale Bedeutung in der Unternehmens-EDV zu.

Die gängige Abkürzung ist RZ, organisationsabhängig kann mit ZER (zentrale Einrichtung Rechenanlagen) ebenfalls ein Rechenzentrum gemeint sein.

In den Betrieben und staatlichen Einrichtungen der DDR waren entsprechende Einrichtungen häufig mit Organisationsabteilungen verbunden und wurden als Organisations- und Rechenzentrum, abgekürzt ORZ, bezeichnet.

Aufgaben von Rechenzentren[Bearbeiten]

Rechenzentren waren häufig einer administrativen Stelle zugeordnet, zum Beispiel der Finanzverwaltung, einer Forschungseinrichtung, einer Hochschule oder einem kommerziellen Betrieb wie einer Bank oder einer Versicherung. Diese administrativen Stellen haben die Anforderung, große Datenmengen zu verarbeiten, etwa die Steuererklärungen aller Bürger eines Bundeslandes. Deshalb war auch eine umfangreiche Maschinenausstattung notwendig, die nur konzentriert in einem Rechenzentrum gepflegt werden konnte. Mittlerweile ist das Outsourcen von Rechenzentren eine häufige und erfolgreich umgesetzte Option.

In den Prä-PC-Zeiten wurden vom Staat sog. Gebietsrechenstellen geschaffen, die die Aufgabe hatten, Rechenkapazität für staatliche Einrichtungen zur Verfügung zu stellen. Meist unterstanden diese Gebietsrechenstellen den Landesämtern für Statistik und Datenverarbeitung, gelegentlich waren sie auch Hochschulen zugeordnet.[1]

Moderne Rechenzentren stellen eine hochredundante Infrastruktur bereit, in der Server mit minimalen geplanten Ausfallzeiten arbeiten können. Sämtliche für den Betrieb benötigten Anlagen sind mehrfach vorhanden. Beispielsweise sorgen Klimageräte für die dringend benötigte Kühlung der Hochleistungsrechner, es werden allerdings mehr Geräte genutzt als für die im normalen Betrieb abgegebene Wärmemenge benötigt würden. Auf diese Weise können regelmäßig einzelne Aggregate gewartet werden, ohne dass es Auswirkungen auf den gesamten Betrieb hat. Die gleiche Anforderung für die Bereitstellung der Stromversorgung zu erfüllen, ist jedoch deutlich aufwändiger. Moderne hochwertige Server besitzen üblicherweise zwei Netzteile, die unabhängig voneinander den gesamten Server versorgen können. Diese Netzteile werden in einer Kreuzverkabelung mit unterschiedlichen Stromführungen verbunden. Auf diese Weise kann jeweils eine Seite der Stromversorgung gewartet werden, ohne die Server zu stören. Jede Stromversorgung umfasst eine eigene USV und eigene Netzersatzanlagen, deren Wartung somit ebenfalls keine Ausfallzeiten erzeugt. Geräte mit nur einem Netzteil würden dann einen Single Point of Failure darstellen, wenn sie nicht mittels eines automatischen Transferschalters mit der jeweils stromführenden Schiene verbunden werden. Abgeschlossen wird diese Installation mittels eines doppelten (redundanten) Anschlusses der Stromversorgung an unterschiedliche Transformatoren und getrennte Netzbereiche des lokalen Energieversorgungsunternehmens. Wartungen an dieser Infrastruktur sind, trotz der Eigenschaft, dass nun erst nach 3 bis 5 aufeinander folgenden Fehlern eine Störung möglich wird, noch immer sorgfältig zu planende und abzustimmende kritische Eingriffe, da Fehlhandlungen der Infrastruktur-Administration hier noch nicht automatisiert abgefangen werden können.

Organisatorische Aufteilung[Bearbeiten]

Ein normales Rechenzentrum sieht im Rahmen der Betreuung der Geräte eine organisatorische Dreiteilung vor.

Systemtechnik[Bearbeiten]

Die Systemtechnik ist für die Hardware verantwortlich. Die Systemtechniker reparieren defekte Geräte, führen technische Installationen am Gerät aus, kümmern sich um die Verkabelung etc. Die Mitarbeiter aus der Systemtechnik sind in der Regel in der Nähe der elektrotechnischen Berufe anzusiedeln.

Systemverwaltung[Bearbeiten]

Die Systemverwaltung ist für die Administration der Maschinen zuständig. Man spricht daher auch von der Systemadministration bzw. einfach nur von der Administration. Die Mitarbeiter sind für die softwareseitige Konfiguration des Maschinenparks verantwortlich. Wird beispielsweise von der Systemtechnik ein neues Festplattenlaufwerk hardwaremäßig angeschlossen, so muss die Systemverwaltung dafür sorgen, dass dieses Laufwerk auch softwareseitig von den Rechnern erkannt und benutzt werden kann.

Die Verantwortung der Systemverwaltung ist es, die Maschinen am Laufen zu halten, abgestürzte Maschinen wieder aufzusetzen, Software zu installieren und die Systeme zu überwachen. Weiterhin sind die Systemverwalter für die Datensicherheit zuständig, sie arbeiten zum Beispiel Datensicherungspläne („Backuppläne“) aus und sorgen für deren Vollzug. Die Softwareseite des Datenschutzes obliegt ebenfalls der Systemverwaltung.

Die Administration von Software kann in den Bereich der Systemverwaltung fallen, wenn nicht eine eigene Abteilung für derartige Aufgaben benannt worden ist (Datenbanken, Kommunikationssysteme etc.).

Systemverwalter haben meistens eine IT-Ausbildung.

Operating[Bearbeiten]

Das Operating übernimmt tendenziell Hilfsaufgaben, die vom Wechseln des Druckerpapiers, dem Schneiden der Ausdrucke und deren Verteilung oder dem Einlegen von Magnetbändern oder ähnlichem bis zur Umdefinition von Prioritäten in den Prozessabläufen reichen. Operator war in den siebziger Jahren noch ein sehr qualifizierter Beruf; damals sorgten Operateure für die optimale Nutzung der Großrechner. Dazu analysierten sie die anstehenden Prozesse nach ihrem Ressourcenbedarf und sorgten – z. B. durch manuelles Anstarten verschiedener Prozesse – für eine optimale Systemauslastung und für die Vermeidung insbesondere von ressourcenbedingten Störungen oder einem deadlock. Durch die Verbilligung und Leistungssteigerung der Hardware sowie immer intelligentere Betriebssysteme ist dieses Problem heutzutage in der Regel entschärft.

Durch fortschreitende Automatisierung sind viele Aufgaben, die früher von Operateuren wahrgenommen wurden, überflüssig geworden. Eine ihrer Hauptaufgaben besteht heute darin, Rechner nach Abstürzen neu zu starten, neuinstallierte Komponenten von Systemtechnikern oder Administratoren in den Normalbetrieb zu übernehmen oder Auffälligkeiten im Betrieb, insbesondere Netzbetrieb zu erkennen und weiterzumelden. Die Kosten durch Ausfälle rechtfertigen die Personalkosten ohne weiteres.

Räume eines Rechenzentrums[Bearbeiten]

Ein Rechenzentrum auf dem Stand der Technik ist mit zwei Räumen ausgestattet, einem Sicherheitsraum für die sog. Feintechnik (IT-Systeme) und einem Raum für die sog. Grobtechnik (Klimatisierung, Energieversorgung, Löschmittel etc.). Ein Rechenzentrum kann mit einem geräumigen Doppelboden ausgestattet sein, durch den nicht nur die Verkabelung, sondern auch kühle Luft von der Klimaanlage zu den Geräten geführt wird. Netzwerkschränke stehen sich in geschlossenen Reihen mit ihren Vorderseiten oder Rückseiten gegenüber. Weil die Geräte Luft vorn ansaugen und hinten ausblasen, werden damit sogenannte kalte Gänge und heiße Gänge gebildet. Vor den Schränken wird kühle Luft aus dem Boden ausgeblasen und hinter den Schränken warme Luft an der Decke abgesaugt. Eine Maßnahme zur Kostenreduzierung im Rechenzentrum ist die Einhausung von Kaltgängen (auch Kaltgangeinhausung oder Cold Aisle Containment genannt), in die die kalte Luft aus dem Doppelboden einströmt.

Server-Racks mit hohen Wärmeverlustleistungen (> 10 kW pro Rack) sind mit einer Kühlung über einen Druckdoppelboden nicht mehr ausreichend zu kühlen. Dafür gibt es spezielle Rackkühlungen auf Wasser- oder Kältemittelbasis, die die Wärme direkt am Rack abführen.

Die hohe Leistungsdichte und damit einhergehende Wärmeentwicklung erfordert nicht nur aufwendige Maßnahmen zur Kühlung, sondern bewirkt durch den Lärm der in den Geräten enthaltenen Ventilatoren auch, dass während des Aufenthalts im Feintechnikraum evtl. auch ein Gehörschutz erforderlich ist. Eine direkte Rackkühlung ist gegenüber einer indirekten Luftkühlung energieeffizienter und auch weniger laut.

Die Anforderungen an die Verfügbarkeit von Rechenzentren sind hoch. Sie werden deshalb mit redundanten Klimaanlagen, unterbrechungsfreien Stromversorgungen, Brandmeldeanlagen und einer Löschanlage ausgestattet.

Sicherheit in einem Rechenzentrum[Bearbeiten]

Abhängig vom administrativen Umfeld gibt es unterschiedlich starke Sicherheitsanforderungen an Rechenzentren. Meist wird lediglich der Zutritt kontrolliert und die Räume sind durch Alarmanlagen gesichert. Einige sind sogar in einem Bunker untergebracht, der unterirdisch mehrere Stockwerke umfasst, Druckwellen, Hitze und ionisierende Strahlung fernhält und mitunter sogar EMP-gesichert ist. Der Zutritt ist auf jeden Fall strikt reglementiert.

Dem Brandschutz und der Vermeidung von Feuern wird ein besonderer Stellenwert eingeräumt. Neben Brandabschottungen sind es Löschanlagen, die Hardwareschäden minimieren können. Wasser, Löschschaum oder Pulverlöschsysteme können einem Großrechner mehr Schaden zufügen als ein verschmortes Kabel. Aus diesem Grund werden in modernen Rechenzentren vielfach Halone als Löschmittel vorgehalten. Im Gegensatz zu bisher verwendeten Löschgasen beruht deren Wirkung hauptsächlich auf dem Entzug von Wärme, während z. B. Stickstoff oder Argon die Flammen nur durch die Verdrängung des Sauerstoffs bei Flutung des Raumes ersticken. Die Gase sind elektrisch nicht leitfähig und Kurzschlüsse werden vermieden. Durch die Begrenzung der Gaskonzentration auf einen festgelegten Wert sind die Räume von gesunden Personen weiterhin begehbar. Andere Gase wie Kohlenstoffdioxid sind bei neu errichteten Rechenzentren wegen der toxischen Wirkung sogar verboten. Der Einsatz von Löschgasen bewirkt allerdings einen Überdruck, so dass der Einsatz von Druckentlastungsklappen erforderlich ist. Problematisch ist auch die rechtzeitige Früherkennung eines Brandes. Konventionelle punktförmige Brandmelder sind für den Einsatz in einem Rechenzentrum schlecht geeignet, weil durch den Einsatz von Kühlsystemen bis zu 1m dicke Warmluftpolster unter der Decke entstehen können, so dass der Rauch nicht an den Melder gelangt. Darüber hinaus arbeiten moderne Server-Racks mit hohen Luftwechselraten, die den Rauch stark verdünnen. Der Branchenverband BITKOM empfiehlt daher den Einsatz hochsensibler Rauchansaugsysteme[2].

Alternativ oder ergänzend zu einer Branderkennung und automatischen -löschung gibt es auch Sauerstoffverarmungssysteme, die den Anteil des Luftsauerstoffs soweit absenken (von 21% auf 13,5% bis 17%) und durch inertes Gas austauschen (in der Regel Stickstoff), dass sich ein Feuer nur sehr schwer oder gar nicht mehr entzünden kann. Der verbleibende O2-Partialdruck bei z. B. 15% entspricht dem in einer Höhe von 2700 m, so dass es für gesunde Menschen nur minimale Einschränkungen gibt.[3]

Die Archivierung von wichtigen Datensicherungen findet in einem anderen Brandabschnitt mit zum Teil höheren Schutzwertigkeiten (Temperatur im Brandfall max. 50 °C) statt.

Backup-Rechenzentrum[Bearbeiten]

Um für Katastrophen, engl. disaster, (z. B. ein Erdbeben, ein Anschlag oder ein Brand) oder Ausfallzeiten, engl. downtime, (geplant für z. B. Updates oder ungeplant bei Störungen) gerüstet zu sein, gibt es als Redundanz-Szenario das sog. Backup-Rechenzentrum (manchmal auch Geo-Redundanz). Dabei wird ein zweites Rechenzentrum, räumlich vom Originalrechenzentrum deutlich getrennt (je nach Anforderung und möglichen Ausfallszenarien in einem anderen Stadtteil, Land oder sogar Kontinent), möglichst komplett dupliziert. Die Duplizierung gilt sowohl für die Hardware als auch für die Software und die jeweils aktuellen Daten. Sollte das Originalrechenzentrum ausfallen, so kann der Betrieb im Backuprechenzentrum fortgesetzt werden. Limitierende Faktoren sind die Duplizierung der Daten pro Zeiteinheit und die „Umschaltzeit“. Auch eine nur teilweise Redundanz z. B. nur der unternehmenskritischen Systeme und Daten ist aus Kostengründen anzutreffen.

Hochsicherheitsrechenzentren wie earthDATAsafe sind bis zu einigen Dutzend oder gar Hunderten von Metern unter der Erde in Stollen, Bunkern und ähnlichen Umgebungen untergebracht.

Notfallpläne und Ausstattung sehen oft vor, dass die Arbeitsräume der Mitarbeiter bis auf die Ausstattung des einzelnen Arbeitsplatzes 1:1 kopiert werden, sodass die Arbeiten in den Räumlichkeiten des Backup-Rechenzentrums mit sehr kurzer Verzögerung fortgesetzt werden können.

Der Grund für die Aufwendungen in Zeit, Personal und Geld ist nachvollziehbar: Der Ausfall eines Rechenzentrums wird als Unternehmensgefährdung bis hin zur Insolvenz angesehen.

Um die doppelte Ausrüstung nicht nur für den Notfall stehen zu lassen, der nur eher selten eintritt, wird in der Regel auch diese Rechenkapazität genutzt. Es wird daher nach Produktions- und Testsystemen unterschieden. So kann zum Beispiel der Server, der für die Produktion genutzt wird, im Hauptrechenzentrum stehen, während ein identischer Server im Backuprechenzentrum nur zur Entwicklung und zum Testen genutzt wird. Bei einem Ausfall des Hauptrechenzentrums wird der Entwicklungs- und Testserver für die Aufrechterhaltung der Produktivsysteme genutzt. Es ist für diese Zeit dann zwar kein Entwickeln mehr möglich, aber die wichtigere Produktion fällt nicht aus.

In der Kombination aus Haupt- und Backup-Rechenzentrum wächst aber auch die Gefahr, notwendige Erweiterungen und Ergänzungen (Klima, Energie, Zutritt, Überwachung, Energieeffizienz) nicht oder nur verspätet vorzunehmen, da es ja eine vermeintlich weitere Sicherheitsstufe durch das Vorhandensein eines Backup-Rechenzentrums gibt.

Notfall-Management[Bearbeiten]

In jeder Konfiguration von Rechenzentren ist ein Notfall- oder Katastrophenmanagement unabdingbar. Jeder Beteiligte muss im Ernstfall wissen, was zu tun und wer zu informieren ist. Die Grundlage dieses Wissens und Handelns ist das Notfallhandbuch, in dem alle relevanten Informationen über das Rechenzentrum, die eingesetzten Systeme und Infrastrukturen, die „schnelle Eingreiftruppe“ und der Ablaufplan inkl. aller Personen und deren Kontaktdaten enthalten sein müssen. Zur Überprüfung der Notfallszenarien sind realistische und periodische Tests durchzuführen, aber z. B. aus Kostengründen nicht immer machbar.

Stromverbrauch in Rechenzentren[Bearbeiten]

Die rund 52.000 deutschen Rechenzentren verbrauchten 2011 9,7 Terawattstunden Strom[4]. Davon entfällt nur ein Teil auf den tatsächlichen Betrieb der IT[5], ca. 50 Prozent werden durch Kühlung, USV und andere Komponenten verursacht[6].

Alle Maßnahmen, die zu einer effizienteren Ressourcenauslastung des IT-Equipments, einer Reduktion der CO2-Emissionen sowie zu einer höheren Energieeffizienz beitragen, werden unter den Begriff Green IT subsumiert. Seit 2006 zählt Green IT zu den Leitthemen der IT-Branche und konnte sich weitestgehend von dem Vorwurf befreien, bloßes Marketinginstrument zu sein. Herstellerunabhängige Empfehlungen zur Gestaltung einer RZ-Umgebung im Sinne der Green IT sind auf Webseiten der BITKOM[7], von Gartner[8], dem Borderstep Institut[9] und Uptime Institute[10] zu finden.

Besichtigung eines Rechenzentrums[Bearbeiten]

Viele Rechenzentren werden mit personellem und technischem Aufwand überwacht und können nur von autorisiertem Personal betreten werden. Einige Rechenzentren zeigen im Rahmen von Tagen der offenen Türen einen Teil ihrer Systeme kleinen, geführten Besuchergruppen[11]. Kommerzielle Rechenzentren und Anbieter von RZ-Flächen bieten – insbesondere für potenzielle Neukunden – Führungen an.

Siehe auch[Bearbeiten]

Literatur[Bearbeiten]

Weblinks[Bearbeiten]

 Wiktionary: Rechenzentrum – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Einzelnachweise[Bearbeiten]

  1. Rechenzentren-Disput, Computerwoche vom 18. März 1977
  2. BITKOM Leitfaden: Betriebssichere Rechenzentren, 2010, Version 2, S. 35ff.. Bitkom.org. Abgerufen am 20. Oktober 2011.
  3. Funktionsprinzip von OxyReduct
  4. Energieverbrauch und Energiekosten von Servern und Rechenzentren in Deutschland (PDF; 83 kB) Borderstep Institut, Mai 2012
  5. Gartner: 11 Best Practices für eine höhere Energieeffizienz im Rechenzentrum, 2009
  6. BITKOM Leitfaden - Energieeffizienz im Rechenzentrum Band II (2010), PDF 1,2 MB
  7. BITKOM Leitfaden: Energieeffizienz im RZ, 2008. Bitkom.org. Abgerufen am 3. Juli 2010.
  8. Gartner: 11 Best Practices für eine höhere Energieeffizienz im Rechenzentrum, 2009
  9. BMU und Borderstep Report: Energieeffiziente Rechenzentren - Best Practice Beispiele aus Europa, USA und Asien, 2008. Borderstep.de. Abgerufen am 3. Juli 2010.
  10. Revolutionizing Data Center Efficiency, 2009. Uptime Institute. Abgerufen am 3. Juli 2010.
  11. lrz-muenchen.de: Tag der offenen Tür im Leibniz-Rechenzentrum, abgerufen am 23. Juni 2010