Datenmanagement (DATEM)

Inhaltsverzeichnis[Verbergen]

Lernziele

Sie kennen den Zweck des Datenmanagements und seine Aufgaben. Sie wissen, welche Funktionen ein Data Warehouse für das Business Intelligence übernimmt und wie unstrukturierte Daten für betriebliche Entscheidungen zugänglich gemacht werden können. Sie kennen die Bedeutung von Metadaten für das Datenmanagement. Sie wissen, mit welchen Merkmalen Datenqualität spezifiziert werden kann und kennen Aufgabenträger des Datenmanagements.

Definitionen und Abkürzungen

  • BI = Business Intelligence.

  • Data Dictionary = Datenkatalog; System zur Verwaltung von Metadaten.

  • Daten (data) = Information, die zum Zweck der Verarbeitung formalisiert dargestellt ist und aus der andere Information abgeleitet werden kann.

  • Datenbanksystem (database system) = Kombination aus einem DBMS und einer oder mehreren Datenbanken.

  • Datenmodell (data model) = Beschreibung des Inhalts, der Struktur und der Bedeutung von Daten, in der Regel mit der Entity-Relationship-Notation.

  • Datenqualität (data quality) = Gesamtheit der Anforderungen an Daten.

  • Datensystem (data system) = Abbildung der Wirklichkeit in Daten für die Aufgaben eines Unternehmens.

  • DBMS = Database Management System; Datenbankmanagementsystem. Synonym: Datenbankverwaltungssystem.

  • DW = Data Warehouse; 1993 von Inmon geprägte Bezeichnung für eine von den operativen Datenbeständen getrennte, integrierte Datenbasis zur Entscheidungsunterstützung.

  • FASMI = Fast Analysis of Shared Multidimensional Information; 1995 von Pendse/Creeth geprägter Begriff zur Charakterisierung von OLAP.

  • Metadaten (meta data) = Daten, mit denen Nutzdaten beschrieben werden.

  • OLAP = Online Analytical Processing; 1993 von Codd/Codd/Salley geprägter Begriff zur multidimensionalen Analyse von Daten in DW.

  • OLTP = Online Transaction Processing; transaktionsorientierte Verarbeitung von Daten in operativen Datenbanksystemen.

  • OMG = Object Management Group; Konsortium von IT-Herstellern, das Standards für die herstellerunabhängige Entwicklung von Informationssystemen verfasst.

  • SQL = Structured Query Language; Datenbanksprache für relationale Datenbanken.

  • strukturierte Daten (structured data) = Daten, für deren Elemente eine bestimmte Anordnung bzw. Struktur vorgeschrieben ist (z. B. in operativen Datenbanken oder DW). Synonym: formatierte Daten.

  • unstrukturierte Daten (unstructured data) = Daten, für deren Elemente keine bestimmte Anordnung bzw. Struktur vorgeschrieben ist (z. B. Texte, Grafiken, Präsentationen, Tabellenkalkulationen, Videos, Audios). Synonyme: unformatierte oder formatfreie Daten.

Zweck des Datenmanagements
Ziele und Aufgaben des Datenmanagements
Business Intelligence
Metadatenmanagement
Datenqualität
Aufgabenträger des Datenmanagements

Forschungsbefunde

Unger/Kemper berichten über Ergebnisse einer Studie zur Verbreitung selbstständiger BI-Organisationseinheiten sowie Charakteristika ihrer organisatorischen Implementierung (internetbasierte Online-Umfrage unter Mitarbeitern deutscher Unternehmen, „die eine hohe Affinität zum Themenbereich Business Intelligence bzw. Data Warehousing aufweisen“; 403 auswertbare Antworten; Rücklaufquote 49,6 %; Untersuchungszeitraum 2006):
75 % der Unternehmen (bezogen auf 326 Antworten) entwickeln und betreiben bereits seit vier und mehr Jahren integrierte BI-Lösungen.
Unter den eingesetzten BI-Lösungen (318 Antworten, Mehrfachnennungen möglich) dominieren Berichtssysteme (89 %) und Ad-hoc-Analysesysteme (82 %). Des Weiteren finden modellgestützte Analysesysteme (45 %), freie Datenrecherchen (49 %) sowie auf betriebswirtschaftlichen Konzepten beruhende Systeme (46 %) Anwendung.
24 % der Unternehmen (bezogen auf 403 Antworten) sehen keine Notwendigkeit, eine BI-Organisationseinheit einzuführen. 76 % verfügen über eine entsprechende Einheit oder planen ihre Einführung (Einheit bei 65 % existent, bei 11 % in Planung).
Es besteht ein statistisch signifikanter Zusammenhang zwischen Unternehmensgröße und Existenz bzw. Planung von BI-Organisationseinheiten. Die befragten Unternehmen sehen zwar mehrheitlich eigenständige BI-Organisationseinheiten als erforderlich an, allerdings treiben insbesondere große und sehr große Unternehmen die Etablierung solcher Einheiten voran.
In 71 % der Unternehmen (bezogen auf 288 Antworten) sind die BI-Einheiten dem IT-Bereich zugeordnet. In 14 % sind eigenständige Einheiten direkt unterhalb der Geschäftsführungsebene implementiert. Bei 15 % der Unternehmen ist die Einheit einem betrieblichen Fachbereich zugeordnet. Kleinere Unternehmen (Umsatz < 100 Mio. Euro) bevorzugen eine Integration direkt unterhalb der Geschäftsführungsebene. Mit zunehmender Größe der Unternehmen wächst die Tendenz, die BI-Einheiten als Bestandteil der zentralen IT-Bereiche zu integrieren.
30 % der Unternehmen geben an, bis 100 Gigabyte Datenvolumen der BI-Datenhaltung zu betreuen, 25 % 101 bis 1000 Gigabyte, 31 % 1 bis 5 Terabyte und 14 % > 5 Terabyte.
Die Unternehmensberatung Accenture untersuchte Datenmanagement und BI in Europa und Nordamerika (Web-gestützte Befragung von 162 CIOs im März 2007; 63 % in multinationalen, 27 % in nationalen Großunternehmen, keine Angaben zu Grundgesamtheit und Untersuchungszeitraum). 29 % der Befragten geben an, lediglich minimale Anstrengungen zur Verbesserung der Datenqualität unternommen zu haben. 55 % berichten über Programme zur Sicherstellung der Datenqualität in einzelnen Systemen mit kritischen Daten. Nur in 16 % der befragten Unternehmen ist Datenqualität zentraler Bestandteil des Datenmanagements. Allerdings geben 78 % der Befragten an, letzteres in den nächsten drei Jahren realisieren zu wollen. 34 % berichten, Stammdaten nicht über die Grenzen einzelner Anwendungssysteme hinaus zu managen, obwohl 27 % der Unternehmen über ein unternehmensweites Stammdatenmanagement verfügen. 98 % der Befragten wollen innerhalb von drei Jahren ein Stammdatenmanagement implementiert haben, 75 % geben an, dass dies unternehmensweit gültig sein soll. Lediglich in 10 % der befragten Unternehmen gibt es ein wirksames Programm zum Metadatenmanagement. 52 % berichten, keine nennenswerten Bemühungen zur Planung und Steuerung sowie zum Qualitätsmanagement von Metadaten zu unternehmen. 57 % gehen davon aus, dass BI in den nächsten drei Jahren als entscheidender Faktor genutzt wird, um sich von Wettbewerbern abzusetzen, allerdings nutzten 61 % der befragten Unternehmen zum Zeitpunkt der Untersuchung BI noch nicht, um Wettbewerbsvorteile zu erzielen. 39 % der Unternehmen sind lediglich in der Lage, einfache Berichte zu erzeugen, weitere 39 % können Daten nur in einzelnen, eng abgegrenzten Systemen („Silos“) auswerten. Lediglich 22 % geben an, unternehmensweite umfassende Analysen mit betrieblichen Daten durchführen zu können. 76 % der Befragten streben an, innerhalb von drei Jahren unternehmensweite Datenanalysen durchführen zu können.

Accenture: Cultivating high performance through information management. Findings from the Accenture CIO survey 2007: Business intelligence. 2008. http://www.accenture.com; Abruf: 10. Juni 2011

Accenture: Cultivating high performance through information management. Findings from the Accenture CIO survey 2007: Data management and architecture. 2008. http://www.accenture.com; Abruf: 10. Juni 2011


Marcolini berichtet über Ergebnisse von Tests mit großen Datenbeständen, die zeigen, dass das Datenvolumen durch Komprimierung bei Anwendung stringorientierter Methoden auf 55 % bis 60 % reduziert werden kann. Bei Anwendung vertikaler, strukturorientierter Methoden kann das Datenvolumen auf 20 % bis 25 % reduziert werden.

Marcolini, M.: Komprimieren mit FLAM. In: COM – Siemens Computermagazin 6/1986, 41-42


Wang/Kon haben ein Rahmenkonzept für Total Data Quality Management mit den Dimensionen „components of the continuous data quality enhancement process“ (MAI = Measurement, Analysis, Improvement) und „perspectives on which to base solutions“ (ETO = Economics, Technology, Organizations) entwickelt. In empirischen Studien stellten die Autoren u. a. fest, dass 77 % der Liefermängel, die zu einem Umsatzverlust von rd. 1 Mio. US$ führten, auf mangelhafte Datenqualität zurückzuführen waren.
Wang, R. Y. / Kon, H. B.: Toward Total Data Quality Management (TDQM). In: Wang, R. Y. (Ed.): Information Technology in Action. Englewood Cliffs/NY 1993, 179-200


Neumann et al. haben mit dem folgenden Ergebnis den Migrationsaufwand ermittelt und mit dem Aufwand für eine komplette Neuentwicklung verglichen (Fallstudie, 53 ADABAS-Dateien mit rd. 1500 Anwendungen): Der Migrationsaufwand beträgt fünf, der Aufwand für die Neuentwicklung 20 Personenjahre. Mit dem vorgeschlagenen Portierungsmodell wird also eine Aufwandsreduzierung um den Faktor 4 gegenüber der Neuentwicklung erreicht.
Neumann, K. / Koschel, A. / Porscha, W.: Eine Portierungsstrategie für ADABAS-Datenbestände und -Anwendungen nach DB2. In: WIRTSCHAFTSINFORMATIK, 4/1993, 339-345


Schlögl berichtet über die Ergebnisse einer empirischen Untersuchung zum Datenmanagement u. a. (Stichprobenanalyse, N = 11, Interviewtechnik, Untersuchungszeitraum Mitte 1994): Eine unternehmensweite Informationsbedarfsplanung wird in fünf Unternehmen durchgeführt; in zwei Unternehmen existiert ein unternehmensweites Datenmodell; fünf Unternehmen haben Datenelemente-Standards entwickelt; fünf Unternehmen verwenden ein Datenkatalog-System.
Schlögl, Ch.: Ausprägungsgrad des Datenmanagements in steirischen Großunternehmen. In: In: Rauch, W. et al. (Hrsg.): Mehrwert von Information – Professionalisierung der Informationsarbeit. Konstanz 1994, 527-535


Jeusfeld/Jarke berichten über ein Forschungsprojekt, das sich mit Qualitätsmanagement in Data Warehouses beschäftigt. Ein erstes Ergebnis ist eine Variante des Goal-Question-Metric-Ansatzes, die über die Metadatenbank des Data Warehouses operationalisiert wird. Ziel ist eine Entwurfsmethode, mit der ein Data Warehouse so entworfen wird, dass die Qualitätsforderungen der Beteiligten berücksichtigt werden. Dazu ist zunächst ein Rahmenkonzept erforderlich, mit und in dem die Qualitätsforderungen formuliert und ihr gegebener Erfüllungsgrad analysiert werden kann.
Jeusfeld, M. A. / Jarke, M.: Qualitätsanalyse im Data Warehousing. Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein!. Abruf am 11.10.2004


Röthlin berichtet über die Ergebnisse einer Studie zum Datenqualitätsmanagements in ERP-Systemen (schriftliche Befragung Schweizer ERP-Anbieter, N = 111, R rd. 45 %). Themen waren die Relevanz der Datenqualität, der Marktauftritt in Bezug auf Datenqualität, technische und betriebliche Einflussfaktoren auf die Datenqualität sowie die Verbreitung von Sicherungsmaßnahmen. Die Studie zeigt, dass Datenqualität im Marktauftritt der ERP-Anbieter eine wichtige Rolle spielt; ERP wird mit hoher Datenqualität assoziiert. Bei den Einflussfaktoren auf die Datenqualität zeigte sich, dass Benutzerschulung als wichtigste Einflussgröße angesehen wird, gefolgt von Support Organisation und Dokumentation.

Röthlin, M.: Datenqualitätsmanagement in ERP-Systemen von Schweizer Unternehmen. Arbeitsbericht 156, Institut für Wirtschaftsinformatik der Universität Bern, 12/2003

Aus der Praxis

Hill/Ariyachandra/Frolick berichten, dass 50 bis 60 % der Projekte zur Einführung von DW in Unternehmen nicht zum geplanten Termin fertiggestellt werden, die Plankosten überschreiten und/oder nicht die geforderte Qualität erreichen. Auf der Grundlage von publizierten Erfahrungen mit Projekten formulieren sie zehn Prinzipien die zum Scheitern von DW-Projekten beitragen:

  1. Implementierung eines DW ohne Berücksichtigung der Unternehmensziele sowie ohne Unterstützung durch Führungskräfte (create now, strategize later).

  2. Implementierung eines DW für einen aktuellen, spezifischen BI-Bedarf und nicht zur Deckung von sich mittel- bis langfristig entwickelnden Informationsbedarfen (build the DW as a solution to a specific BI project/need).

  3. Implementierung eines DW ohne Machbarkeitsstudie oder Pilotprojekt (save time and money: skip the pilot/proof of concept).

  4. Entwicklung eines DW als umfangreichen, zentralisierten Datenbestand, bei gleichzeitiger Vernachlässigung anwendungsspezifischer Segmente (Data-marts) (assume users will patiently wait for the release).

  5. Sparsame Kommunikation über Projektziele und Projektfortschritt mit Auftraggebern und DW-Anwendern (with project management communication, less is more).

  6. fehlende oder mangelhafte Analyse von Kosten und Nutzen des DW (don’t worry about what erveryone else is doing).

  7. Ignorieren von Warnzeichen, insbesondere mangelnde Unterstützung durch Führungskräfte und fehlende Akzeptanz der Nutzer (run the red lights or do not stop at checkpoints).

  8. Fällen wichtiger Entscheidungen ausschließlich durch IT-Fachleute statt durch alle an der DW-Implementierung beteiligten Interessengruppen (delegate all technology decisions to IT).

  9. Unterschätzung des Aufwands für das Extrahieren, Transformieren und Laden (ETL) von Daten aus operativen Systemen in das DW (there’s no need to get into the weeds with something like ETL development).

  10. Beauftragung von preisgünstigen, aber wenig erfahrenen Beratern und Softwarelieferanten sowie Nutzung von unausgereiften Softwareprodukten (choose a low-cost consultant/vendor).

Hill, A. / Ariyachandra, T. / Frolick, M.: 10 Principles to Ensure Your Data Warehouse Implementation is a Failure. In: International Journal of Business Intelligence Research 2/2011, 37-47


Wixom et al. beschreiben Erfahrungen mit dem DW-gestützten BI bei der amerikanischen Fluggesellschaft Continental Airlines. In diesem Unternehmen wird seit 1998 ein DW betrieben, ursprünglich zur Unterstützung der Preisgestaltung und zur Auswertung von Daten aus einem Vielfliegerprogramm, später auch zur Analyse von Lohn- und Gehaltsdaten sowie im Rahmen des Qualitätsmanagements bzw. der Betriebssicherheit. Das DW stellt Daten für 70 Anwendungen und 1400 Anwender in über 75 Niederlassungen weltweit bereit. Ein Team von 15 Mitarbeitern betreibt, wartet und erweitert das DW. Wixom et al. fassen folgende Empfehlungen zusammen, die aus Erfahrungen mit BI im Laufe von zehn Jahren bei Continental Airlines gesammelt wurden: Es sollten standardisierte Namenskonventionen, normalisierte Datenstrukturen und benutzerfreundliche, einfach verständliche Metadaten verwendet werden. Abgesehen von wenigen Ausnahmen (z. B. Lohn- und Gehaltsdaten oder Kreditkartennummern von Passagieren) sollten Nutzer des DW Zugriff auf alle Daten erhalten, um möglichst flexibel Analysen betreiben zu können. Daten sollten als Vermögensgegenstand des Unternehmens betrachtet und entsprechend sorgfältig behandelt werden. Mitarbeiter eines DW-Teams sollten sowohl fundierte Datenbankkenntnisse als auch Erfahrungen in den Anwendungsbereichen haben, welche die Daten nutzen.
Laut einer Untersuchung von The Data Warehouse Institute (zitiert nach Computer Zeitung 38/2007, 8) ist der Kunde das am häufigsten in Stammdaten definierte Objekt. In der Regel wird der Begriff Kunde von verschiedenen Fachabteilungen eines Unternehmens unterschiedlich verstanden. So definiert der Versand z. B. Personen und Organisationen, an die ein Produkt versendet worden ist, als Kunden, während in der Buchführung nur Rechnungsempfänger als Kunden bezeichnet werden. 13 % der Untersuchungsteilnehmer geben an, dass es in ihrem Unternehmen nur eine Definition von Kunde gibt. 50 % berichten über ca. zehn verschiedene Definitionen, 19 % über 50 oder mehr Definitionen von Kunde in ihrem Unternehmen. Eine ähnliche Begriffsvielfalt gibt es bei Stammdaten zu Produkten, Mitarbeitern und Lieferanten. Dies bedingt, dass Stammdatenmanagement in erster Linie als Aufgabe der Fach- und erst in zweiter Linie als Aufgabe der IT-Abteilungen verstanden werden muss.

Methodenverweise

Fallstudienverweis

Kontrollfragen

  1. Welche Argumente stützen die Behauptung, Daten seien ein wirtschaftliches Gut?
  2. Worin besteht der Unterschied zwischen OLAP und Data Mining?
  3. Welche Ziele werden mit Business Intelligence verfolgt?
  4. Wie lässt sich Metadatenmanagement wirtschaftlich rechtfertigen?
  5. Mit welchen QM-Maßnahmen kann der Forderung nach angemessener Datenqualität entsprochen werden?
  6. Worin besteht der Zweck des Datenmanagements?
  7. Welche Aufgaben des Datenmanagements lassen sich unterscheiden?
  8. Worin besteht der Unterschied zwischen OLAP und Data Mining?
  9. Welche Funktion haben Metadaten im Datenmanagement?
  10. Mit welchen Attributen kann Datenqualität beschrieben werden?

Quellen

  • Accenture: Cultivating high performance through information management. Findings from the Accenture CIO survey 2007: Business intelligence. 2008. http://www.accenture.com; Abruf: 10. Juni 2011

  • Accenture: Cultivating high performance through information management. Findings from the Accenture CIO survey 2007: Data management and architecture. 2008. http://www.accenture.com; Abruf: 10. Juni 2011

  • Becker, J. / Rosemann, M. / Schütte, R.: Grundsätze ordnungsmäßiger Modellierung. In: WIRTSCHAFTSINFORMATIK 5/1995, 435–445

  • Chamoni, P. / Gluchowski, P.: Analytische Informationssysteme: Business Intelligence-Technologien und Anwendungen 3. A., Berlin/Heidelberg/New York 2006

  • Chaudhuri, S. / Dayal, U.: An Overview of Data Warehousing and OLAP Technology. In: ACM SIGMOD Record 1/1997, 65–74

  • Chen, P. P.-S.: Entity-Relationship Modeling: Historical Events, Future Trends, and Lessons Learned. Lecturing Notes in Computer Sciences. In: Broy, M. / Denert, E. (Hrsg.): Software Pioneers: Contributions to Software Engineering. Berlin 2002, 100–114

  • Chen, P. P.-S.: The Entity-Relationship Model - Toward a Unified View of Data. In: ACM Transactions on Database Systems 1/1976, 9–36

  • Codd, E. F. / Codd, S. B. / Salley, C. T.: Providing OLAP to User-Analysts: An IT Mandate. Ann Arbor 1993

  • Dippold, R. et al.: Unternehmensweites Datenmanagement. Von der Datenbankadministration bis zum Informationsmanagement. 4. A., Braunschweig/Wiesbaden 2005

  • Dumslaff, U. / Lempp, P.: Studie IT-Trends 2011. Zukunft sichern in der Krise. Berlin 2011. http://www.de.capgemini.com; Abruf 15. Juni 2011

  • Feldman, S.: The high cost of not finding information. 2004. http://www.kmworld.com; Abruf: 10. Juni 2011

  • Feldman, S. et al.: The Hidden Costs of Information Work. IDC Whitepaper. Framingham 2005. http://www.interwoven.com; Abruf: 10. Juni 2011

  • Hawking, D.: Challenges in enterprise search. In: Schewe, K.-D. / Williams, H. (Hrsg.): Proceedings of the Fifteenth Australasian Database Conference. Dunedin, New Zealand 2004, 15–24

  • Hill, A. / Ariyachandra, T. / Frolick, M.: 10 Principles to Ensure Your Data Warehouse Implementation is a Failure. In: International Journal of Business Intelligence Research 2/2011, 37–47

  • Inmon, W. H.: Building the Data Warehouse. 4. A., Indianapolis 2005

  • Kappelman, L. A.: Some Strategic Y2K Blessings. In: IEEE Software 2/2000, 42-46

  • Kemper, H.-G. / Mehanna, W. / Unger, C.: Business Intelligence - Grundlagen und praktische Anwendungen. Eine Einführung in die IT-basierte Managementunterstützung. 2. A., Wiesbaden 2006

  • Naumann, F.: Datenqualität. In: Informatik Spektrum 1/2007, 27–31

  • o.V.: Firmen gehen Management von Stammdaten oft falsch an. In: Computer Zeitung 38/2007, 8

  • Pendse, N. / Creeth, R.: The OLAP Report. New York 1995

  • Röthlin, M.: Management of Data Quality in Enterprise Resource Planning Systems. Lohmar, Köln 2010

  • Rohweder, J. P. et al.: Informationsqualität - Definitionen, Dimensionen und Begriffe. 2007. http://www.dgiq.de, Abruf: 22.05.2008

  • Unger, C. / Kemper, H.-G.: Organisatorische Rahmenbedingungen der Entwicklung und des Betriebs von Business Intelligence – Ergebnisse einer empirischen Studie. In: Bichler, K. et al. (Hrsg.): Multikonferenz Wirtschaftsinformatik 2008. Berlin 2008, 141–153

  • Wang, R. / Strong, D.: Beyond Accuracy: What Data Quality Means to Data Consumers. In: Journal of Management Information Systems 4/1996, 5–34

  • Wixom, B. H. et al.: Continental Airlines Continues to Soar with Business Intelligence In: Information Systems Management 2/2008, 102–112

Vertiefungsliteratur

  • Baars, H. / Kemper, H.-G.: Management Support with Structured and Unstructured Data - An Integrated Business Intelligence Framework. In: Information Systems Management 2/2008, 132–148

  • Devlin, B.: Data warehouse: from architecture to implementation. 6. A., Reading 2000

  • Elmasri, R. / Navathe, S. B.: Grundlagen von Datenbanksystemen. 3. A., München 2002

  • Eppler, M. J.: Managing Information Quality. Increasing the Value of Information in Knowledge-intensive Products and Processes. Berlin, Heidelberg 2003

  • Salton, G. / McGill, M. J.: Information Retrieval - Grundlegendes für Informationswissenschaftler. Hamburg et al. 1987

  • Stock, W. G. / Stock, M.: Wissensrepräsentation. Informationen auswerten und bereitstellen. München 2008

  • Vetter, M.: Aufbau betrieblicher Informationssysteme mittels pseudo-objektorientierter, konzeptioneller Datenmodellierung. 8. A., Stuttgart 1998

Informationsmaterial

Normen

  • ISO 15836:2009 Information and documentation - The Dublin Core metadata element set

  • ISO/IEC 19502:2005 Information technology - Meta Object Facility (MOF)

  • ISO/IEC 19503:2005 Information technology - XML Metadata Interchange (XMI)