Detaillierte Informationen zum Seminar
Inhalte:
Grundlegende Einblicke in das Feld des Maschinellen Lernens:
- Einführung in das Gebiet des Maschinellen Lernens
- Erläuterung der Unterschiede zwischen überwachtem und unüberwachtem Lernen
- Überwindung von Overfitting durch kluge Datasplitting-Strategien (Training vs. Testdaten)
Basiswissen zur Linearen Regression:
- Verständnis für den Linearen Regressionsalgorithmus aufbauen
- Richtige Aufteilung von Daten in Training und Test
- Praktische Umsetzung der Linearen Regression in Python (mit scikit-learn)
- Solide Überprüfung der Ergebnisse
Eintauchen in die Logistische Regression (unter Nutzung von StatsModels):
- Aufbau des Verständnisses für die Logistische Regression (Entwicklung von linear zu logistisch)
- Sorgfältige Datenaufteilung für Training und Test
- Implementierung der Logistischen Regression in Python
- Kritische Prüfung und Bewertung der Ergebnisse und des Modells (AIC, BIC, Konfusionsmatrix)
- Erläuterung der Koeffizienteninterpretation (Odds-Ratio)
- Roc Curve und Fläche unter der Kurve (AUC) im Fokus
Tiefere Einblicke in den Entscheidungsbaum-Algorithmus:
- Verständnis für den Entscheidungsbaum-Algorithmus entwickeln
- Richtige Aufteilung von Daten in Training und Test
- Konkrete Umsetzung des Entscheidungsbaums in Python (mit scikit-learn)
- Feintuning der Hyperparameter für optimale Leistung
- Sorgfältige Validierung der Ergebnisse (Konfusionsmatrix, Genauigkeit)
- Anwendung des Entscheidungsbaums für Regressionsszenarien
Ensemble-Methoden und ihre Effektivität:
- Ein Ensemble aus verschiedenen Algorithmen mit scikit-learn realisieren
- Random Forest für Klassifikation und Regression nutzen
- Einsatz von Ada Boost für Klassifikation und Regression verstehen
- Feintuning der Hyperparameter für optimierte Ergebnisse
- Akkurate Bewertung der Modellleistung durch gezielte Validierung
Erkundung weiterer Schlüsselalgorithmen:
- K-Nearest Neighbor-Verfahren beleuchten
- Einfaches Neuronales Netz (Multi-Layer Perceptron, MLP) betrachten
- Direkte Umsetzung der Algorithmen in Python
- Gründliche Ergebnisüberprüfung und -bewertung
Optimierung von Hyperparametern und Anwendung von Kreuzvalidierung:
- Automatisierte Suche nach optimalen Hyperparametern
- Kreuzvalidierung (Cross-Validation) als Schlüssel zur Modellbewertung
- Umsetzung dieser Konzepte in scikit-learn
Erkundung von Clustering-Algorithmen:
- Basisverständnis für K-Means Clustering und DBScan erlangen
- Interpretation der Ergebnisse von Clustering-Vorgängen
- Vergleich der Ergebnisse verschiedener Clustering-Methoden
Dauer/zeitlicher Ablauf:
2 Tage
Teilnahmevoraussetzungen:
Diese Schulung zum Thema Machine Learning erfordert Programmiererfahrung in Python. Es ist wichtig, bereits Erfahrung in der Arbeit mit Python und Daten zu haben. Der Kurs Data Science mit Python gibt einen Überblick über die erforderlichen Vorkenntnisse, um gut an dem Seminar teilnehmen zu können. Insbesondere sollten Sie Kenntnisse über pandas Data.Frames (Ergänzen fehlender Werte, Einlesen von Daten), Installation und Laden von Bibliotheken, Schreiben eigener Funktionen sowie Kenntnisse über verschiedene Datenstrukturen (Liste, Wörterbuch, Tupel) haben.
Darüber hinaus sind grundlegende Kenntnisse in Statistik (Definitionen wie Durchschnitt, Median, Standardabweichung, Normalverteilung), grundlegende mathematische Symbole und Begriffe (Summenzeichen, Integral, Funktion, Ableitung, Exponentialfunktion) und Kenntnisse der booleschen Algebra mit den logischen Operatoren (UND, ODER, NICHT) erforderlich.
Die Schulung zum Thema Machine Learning wird auf Deutsch durchgeführt. Englischkenntnisse (insbesondere im Verständnis englischer Texte) sind sehr empfehlenswert, da die Programmiersprache, Fachbegriffe und die Dokumentationen im Internet auf Englisch sind. Aus diesem Grund sind auch die erstellten Folien in der Schulung auf Englisch.
Lehrgangsverlauf/Methoden:
Das Seminar legt großen Wert auf Praxisorientierung. Die Teilnehmer haben die Möglichkeit, direkt und eigenständig mit der Programmiersprache Python in der Entwicklungsumgebung Spyder zu arbeiten. Dadurch können sie das Gelernte sofort in Übungen anwenden und vertiefen. Der Trainer unterstützt die Teilnehmer dabei, indem er verschiedene Aufgaben moderiert und sie durch die einzelnen Lehreinheiten begleitet.
Zielgruppe:
Dieser Python-basierte Machine Learning Kurs richtet sich an Fachleute wie Data Scientists, angehende Machine Learning Engineers, Datenanalysten, Business Intelligence Analysten und Data Analysten, die ihre Programmierkenntnisse in Python für Data Science und Data Mining vertiefen möchten. Die Schulung erweitert vorhandene Python-Programmierkenntnisse, um eigenständig Machine Learning mit scikit-learn umsetzen zu können
Seminarkennung:
54500