Berufsbild Data Scientist: Welche Kompetenzen gefragt sind
Data Science gilt sowohl in der Wirtschaft als auch in der Wissenschaft als eine Schlüsseldisziplin unserer Zeit. Welche Kompetenzen gefragt sind, um große Datenmengen zu erheben, zu verarbeiten, aufzubereiten und zu analysieren, ermittelte die Gesellschaft für Informatik e.V. (GI) unter Mitwirkung der Plattform Lernende Systeme in einem aktuellen Arbeitspapier. Es liefert Orientierung für die Weiterentwicklung der Lehre an Hochschulen und Universitäten sowie in der Aus- und Weiterbildung.
Daten sind ein zentraler Rohstoff der Wirtschaft wie auch der Forschung. Aus ihrer zweckorientierten Analyse entstehen – unter anderem mit Methoden der Künstlichen Intelligenz – neue Erkenntnisse, Entscheidungshilfen und Wettbewerbsvorteile. Zu den Zielen der von der Bundesregierung Ende 2019 beschlossenen Eckpunkte einer Datenstrategie zählt daher, mehr Menschen, Unternehmen, wissenschaftliche Einrichtungen und zivilgesellschaftliche Organisationen zu befähigen, Daten effektiv und verantwortungsvoll zu nutzen.
Für die dazu benötigte Expertise gilt es, Data Science und den Umgang mit Daten insbesondere an den Hochschulen und Universitäten, aber auch in der Aus- und Weiterbildung auszubauen. Welche Kompetenzen im Einzelnen zu stärken sind, hat die Gesellschaft für Informatik e.V. (GI) in einer interdisziplinären Arbeitsgruppe unter Mitwirkung der Plattform Lernende Systeme erarbeitet. »Mit unserem Arbeitspapier wollen wir die Ausgestaltung von Studiengängen sowie von Aus- und Weiterbildungsangeboten erleichtern und dabei helfen, die richtigen Themen im Bereich Data Science zu adressieren«, so Daniel Krupka, Geschäftsführer der GI.
Als Lern- und Ausbildungsinhalte für künftige Data Scientists definierten die Autor*innen insgesamt 14 Kompetenzfelder: Grundlagen der Mathematik und Statistik, Fortgeschrittene Mathematik und Statistik, Grundlagen der Informatik, Fortgeschrittene Informatik, Kryptographie und Sicherheit, Datenethik und Data Privacy, Data Governance, Datenintegration, Datenvisualisierung, Data Mining, Maschinelles Lernen/Deep Learning, Business Intelligence, Domänenspezifische Anwendungen sowie Kommunikation mit Fachexperten und Implementierung von Data Science in der Organisation.
In welcher Tiefe die Inhalte der einzelnen Kompetenzfelder vermittelt werden müssen, hängt von den jeweiligen Zielgruppen ab. »So bringen etwa Studierende der Kulturwissenschaften und des Ingenieurswesens unterschiedliche Voraussetzungen in ein aufbauendes Data Science-Studium mit – und werden im Anschluss auch an sehr unterschiedlichen Fragestellungen arbeiten. Diese Differenzierungen sollten berücksichtigt werden, damit wir genau die Spezialisten ausbilden, die wir benötigen«, so Ulf Brefeld, Professor für Maschinelles Lernen an der Leuphana Universität Lüneburg und Mitglied der Plattform Lernende Systeme.
Die Autor*innen des Arbeitspapiers definieren drei idealtypischen Personengruppen, die stellvertretend für die unterschiedlichen Vorrausetzungen und Aspekte in der akademischen Ausbildung stehen. Ihnen werden jeweils konkrete Lerninhalte zugeschrieben:
- Persona A besitzt einen Bachelor in Informatik, Mathematik/Statistik oder ggf. in Data Science und verfügt damit über nachweisbare Kenntnisse in Statistik, Information Engineering oder Künstliche Intelligenz (KI). Sie strebt einen Master in Data Science an, um später als Data Scientist in der Industrie oder Forschung zu arbeiten.
- Persona B verfügt über einen Bachelor in einer Domänenwissenschaft – sei es in einem technischen, naturwissenschaftlichen oder auch geisteswissenschaftlichen Fach – und möchte Data-Science-Kompetenzen für diese Domäne erwerben.
- Persona C steht mitten im Beruf und kann einschlägige informatische und mathematische Kenntnisse nachweisen. Ihr Ziel ist es, Data-Science-Kompetenzen für die praktische Anwendung im Job zu erwerben.