Datenbanken & Data Mining

 

Seit den 1970er Jahren haben sich Datenbanken zu einer der am weitest verbreiteten Computertechnologien entwickelt. Fortune-500 Unternehmen operieren heute üblicherweise mit mehr als 10.000 großen Datenbanken. Sowohl Unternehmenssoftware (SAP) als auch riesige Endbenutzer-Anwendungen (Amazon, Facebook) bauen auf Datenbanktechnologien. Meta-Datenbanken (z.B. EDV-Produktkataloge) durchdringen Ingenieur-, Naturwissenschaften und Medizin. Vor zehn Jahren postulierte der Turing-Preisträger Jim Gray demzufolge eine Ära der „datenzentrierten Wissenschaft“, in der neue wissenschaftliche Ergebnisse aus der Extraktion riesiger Mengen vorhandener Daten stammen. Data Mining ist inzwischen eine Standardtechnologie im Marketing wie auch im wissenschaftlichen Datenmanagement.
Seit dem Beginn des neuen Jahrhunderts hat sich der Umfang von Datenbanken und Data Mining deutlich erweitert. Erstens hat sich durch das Wachstum des World-Wide-Webs der Medienumfang um massive Mengen an Text (z.B. Google), Bildern (z.B. Flickr), Video (z.B. YouTube), Audio und gesprochener Sprache ausgeweitet. Zweitens erzeugt das „Internet der Dinge“ ein massives Wachstum an Datenströmen von mobilen Systemen und Sensornetzwerken. Drittens müssen leistungsstarke Simulationsausgangsdaten analysiert und in einer nie dagewesenen Geschwindigkeit für die spätere Wiederverwendung gespeichert werden. Insgesamt übersteigt die Datenexplosion bei weitem die Möglichkeiten und Wachstumsraten vorhandener Daten-Management-Technologien. Dies führt zur so genannten Big Data-Challenge. Erforscht werden hochparallele Basisalgorithmen wie etwa Map Reduce und Datenbankspeicherverfahren wie etwa Hadoop, aber auch traditionelle Datenbanken werden durch neue spaltenorientierte Speichertechniken wie bei SAP HANA erheblich beschleunigt.

Ansprechpartner

Telefon

work
+49 241 80 21000

E-Mail

E-Mail