Um was dreht es sich bei Data Warehouse?
Data Warehouse wird überwiegend von Firmen genutzt. Es ist ein zentrales Datenbanksystem, welches zur Analyse genutzt wird.
Die Wortherkunft von Data Warehouse
Es ist die Bezeichnung für eine Plattform/ einen Speicherort, der zentral alle Daten einer Firma speichert, auch wenn verschiedene Systeme genutzt werden. Es handelt sich also um ein Lager für Daten. Dieses Datenlager wird zu Analysezwecken verwendet. Siehe auch weitere Infos über Data Warehouse.
Die Vorteile von Data Warehouse
- Alle Daten, mit denen ein Unternehmen arbeitet, werden zentral gesammelt.
- Die gespeicherten Daten sind unverfälscht und strukturiert.
- Es benötigt nur wenige Klicks, um die Daten abzurufen, was die Datenverwaltung effizient macht.
Das Besondere an Data Warehouse:
Mit Data Access Tools, wie Data Marts können Datenauszüge konzipiert werden. Dadurch ist es möglich, die Daten individuell nach Vorgaben und Mustern zu analysieren. Diese Analysen werden als Basis genutzt, um betriebliche Kennzahlen zu bestimmen. Unter Data Warehouse oder Data Warehousing fallen alle Prozesse die im Rahmen der Beschaffung, der Sicherung und der Verwaltung der Daten anfallen.
Kurz zusammengefasst, wie sich Data Warehouse aufbaut:
- Die Datenbeschaffung, indem sie auf den Systemen geholten werden.
- Die Speicherung der Daten und deren Langzeitarchivierung.
- Bereitstellung der Daten durch Data Marts.
- Die Daten auswerten.
Die technologische Grundlage von Data Warehouse:
Die Data Warehouse Architektur besteht aus den vier unterschiedlichen Bereichen:
- Quellsysteme
- Data Staging Area
- Data Presentation Area
- Data Access Tools, wie Data Marts
Im ersten Schritt werden die Daten aus den verschiedenen Systemen gezogen und bereitgestellt. In der Staging Area werden die extrahierten Daten strukturiert und transformiert. Dann wandern die Daten in die Data Warehouse Datenbank. Diese Datenbank ist die Data Presentation Area. Auf diese Datenbank und alle nachgelagerten Systeme kann man einzeln zugreifen. Dieser einzelne Zugriff erfolgt mit Data Marts, den Data Access Tools. Data Warehouse nutzt relationale Datenbanken. Dabei handelt es sich um Datenbanken, welche die Speicherung und den Zugriff auf miteinander verbundene Datenpunkte erlaubt. So können Daten mit SQL abgefragt werden.
Wenn extrem große Datenmengen gespeichert werden sollen, werden oft OLAP-Datenbanken genutzt. Die Daten des Data Warehouse werden regelmäßig ergänzt, sprich aktualisiert. Es gibt immer mehr Systeme, welche einen Datenzugriff in Echtzeit erlauben. Bei Data Warehouse handelt es sich um das perfekte Werkzeug, um Systeme die operativ und auswertend arbeiten getrennt zu halten. Dadurch kann eine steuerbare Datenanalyse in Echtzeit stattfinden.
Die Einsatzgebiete von Data Warehouse
Data Warehouse ist flexibel einsetzbar. Es hilft mit seinen Analysemöglichkeiten Unternehmenskennzahlen zu berechnen, welche bei der Entscheidungsfindung wichtig sind. Data Warehouse kann genutzt werden Ressourcen oder Kosten zu ermitteln. Es können Prozesse im Unternehmen analysiert werden, beispielsweise in der Produktion oder dem Vertrieb. Es können Statistiken und Reporte erstellt werden. Die Daten von Data Warehouse können zudem genutzt werden, um zu harmonisieren und zu strukturieren.
Ein gutes Team: Data Warehouse und Data Lake
In der Data Warehouse finden sich überwiegend Daten, die strukturiert sind und in SQL-Datenbanken erfasst sind. Handelt es sich um Big-Data, geht es um extrem große Datenmengen, welche unstrukturiert sind. Diese Menge an Daten kann die Möglichkeiten Con SQL-Datenbanken sprengen. Daher gibt es die Kombination aus Data Warehouse und Data Lake.
Was ist Data Lake?
Das Konzept von Data Lake ist es, große Datenmengen ablegen zu können, die eine große Speicherkapazität benötigen. Für Data Lake ist es kein Problem auch große Datenmenge und Struktur zu verarbeiten.
(Bildquelle: Pixabay.com – CC0 Public Domain)