Webinar - Bildungswerk der Bayerischen Wirtschaft (bbw) gGmbH
Das Data Scientist Training mit dem Fokus auf die Python Anwendung befähigt Sie, Daten zu analysieren und auf Grundlage dieser Vorhersagen zu erstellen, um datengetriebene Entscheidungen treffen zu können.
Termin | Ort | Preis* |
---|---|---|
29.12.2024- 15.05.2025 | online | 4.195,00 € |
Der Beruf des Data Scientist gilt als einer der gefragtesten des 21. Jahrhunderts. Sie erlernen in diesem Training unüberwachtes und überwachtes maschinelles Lernen, unterschiedliche Datenvisualisierungsmethoden und das Data Storytelling kennen, sodass sie im Anschluss an das Training die Rolle des Data Scientist übernehmen können.
Sie lernen, Machine Learning Algorithmen zu implementieren und zu optimieren. Ebenso werden Kompetenzen aufgebaut für gängige Visualisierungsmethoden.
Inhalte
MODUL 0: PREPARATION Data Analytics:
Teilnehmende frischen die wichtigsten Grundlagen zur Datenverarbeitung mit Pandas, Datenvisualisierung mit Matplotlib und Seaborn und Datenbankabfrage mit SQL Alchemy auf.
Linear Algebra:
Teilnehmende machen sich mit dem mathematischen Hintergrund von Data Science Algorithmen vertraut.
Probability Distributions:
Teilnehmende erfahren mehr über den statistischen Hintergrund von Data Science Algorithmen.
MODUL 1: MACHINE LEARNING BASICS Regression:
Anhand der linearen Regression erlernen Teilnehmende den Umgang mit dem Python Paket sklearn.
Supervised Learning (Classification):
Teilnehmende werden in Klassifizierungsalgorithmen eingeführt.
Clustering:
Teilnehmende bekommen den k Means Algorithmus als Beispiel des unüberwachten Lernens vorgestellt.
Unsupervised Learning (Dimensionality Reduction):
Teilnehmende erlernen, wie sie mithilfe einer Principal Component Analysis (PCA) die Dimension der Daten verringern können.
Outlier Detection:
Teilnehmende bekommen Ansätze gezeigt, um Ausreißer zu identifizieren und verstehen.
MODUL 2: DEEP DIVE SUPERVISED LEARNING Data Gathering:
Teilnehmende erlernen, Daten zu sammeln.
Logistic Regression:
Teilnehmende nutzen Performance Metriken zur Evaluation der Ergebnisse und erfahren, wie sie nichtnumerische Daten nutzbar machen.
Decision Trees and Random Forests:
Teilnehmende lernen den Entscheidungsbaum als leicht zu interpretierendes Modell kennen.
Support Vector Machines:
Teilnehmende lernen einen letzten Klassifizierungsalgorithmus.
Neural Networks:
Teilnehmende werden in künstliche neuronale Netze eingeführt.
MODUL 3: ADVANCED TOPICS Visualization and Model Interpretation:
Teilnehmende erlernen Methoden zur Interpretation und Visualisierung von Machine Learning Modellen.
Spark:
Teilnehmende erfahren, weshalb die Arbeit mit verteilten Speichersystemen relevant ist.
Exercise Project:
Teilnehmende bearbeiten ein Prädiktionsproblem und setzen ihre Data Science Fähigkeiten eigenständig ein.
Final Project:
Teilnehmende erhalten ein weiteres größeres Datenset, das sie selbstständig analysieren und lösen müssen.
Sie erlernen Performance Metriken und Annahmen von Modellen des Lernens mit sklearn anzuwenden. Darüber hinaus werden die Grundlagen des Storytellings und Best Practices der informativen Gestaltung von Visualisierungen mit bokeh Algorithmen des überwachten und unüberwachten Lernens, wie Entscheidungsbäume und Random Forests erlangt.
Die Weiterbildung eignet sich für alle, die Python als Programmiersprache einsetzen, Daten analysieren und auf Grundlage dieser Vorhersagen erstellen möchten.