Seminare
Seminare

Bootcamp - Machine Learning und Data Science mit Python

Webinar - PROKODA GmbH

Bootcamp - Machine Learning und Data Science mit Python
Termin Ort Preis*
20.01.2025- 24.01.2025 online 3.082,10 €
17.03.2025- 21.03.2025 online 3.082,10 €
12.05.2025- 16.05.2025 Düsseldorf 3.082,10 €
*Alle Preise verstehen sich inkl. MwSt.

Detaillierte Informationen zum Seminar

Inhalte:

Python-Essentials:

  • Installation von neuen Modulen
  • Jupyter Notebooks / Jupyter Lab
  • Verwendung von Funktionen und Methoden
  • Python im Vergleich zu anderen Sprachen

Grundlegende Datenstrukturen:

  • Einführung in grundlegende Datentypen (String, Integer, Float, NaN)
  • Erläuterung wichtiger Strukturen: Liste, Tupel, Wörterbuch
  • Einführung in List Comprehension

pandas-Datenverarbeitung - DataFrames:

  • Erkunden der DataFrame-Struktur (Zeilen, Spalten)
  • Auswahl von Zeilen/Spalten
  • Erstellen, Löschen und Bearbeiten von Zeilen/Spalten
  • Boolean Indexing für Zeilenauswahl

Statistiken direkt in pandas DataFrames berechnen:

  • Einfache Statistiken auf DataFrames (Mittelwert, Min, Max, Summe, Median, Varianz usw.)
  • Daten aggregieren und filtern
  • Fehlende Werte behandeln
  • Kreuztabellen erstellen

Programmablaufsteuerung:

  • Eigene Funktionen erstellen
  • Default-Parameter in Funktionen festlegen (Positional und Keyword Arguments)
  • For-Schleifen verwenden
  • If-Else-Bedingungen implementieren

Datendarstellung mit seaborn / matplotlib:

  • Grundlagen von matplotlib kennenlernen
  • Anpassung von Achsen, Legende, Titel
  • Diagramme speichern
  • In seaborn verschiedene Diagrammtypen erstellen
  • Darstellungen variieren/festsetzen (Größe, Farbe, Gruppierung)

Daten einlesen und speichern:

  • Arbeitsverzeichnis in Python und spyder festlegen
  • Einlesen und Speichern von CSV- und Excel-Dateien
  • Daten von URLs beziehen
  • Überblick über Parameter
  • Lesen und Schreiben im Python-Format pickle
  • Umgang mit großen Daten

Datenbankzugriff mit SQLAlchemy:

  • Verbindung zur Datenbank herstellen
  • Tabellen extrahieren/schreiben
  • SQL-Befehle an die Datenbank senden
  • Datenabfragen per SQL-Statement direkt aus Python

Numpy-Einführung:

  • Einführung in numpy-Arrays und deren Attribute
  • Arrays erstellen und befüllen
  • Mathematische Operationen und Statistikfunktionen

Datenverarbeitung:

  • Daten normalisieren
  • Fehlende Werte ergänzen
  • Dummy-Variablen und One-Hot-Encoding

Machine Learning-Überblick:

  • Grundlagen des Machine Learning
  • Praktische Anwendungen
  • Unterschiede von KI, Machine Learning und Deep Learning
  • Überwachtes und unüberwachtes Lernen
  • Vermeidung von Overfitting, Train-Test-Split

Lineare Regression mit scikit-learn:

  • Aufteilung der Daten, Modellbau und Validierung
  • Grundlagen der linearen Regression
  • Implementierung in Python mit scikit-learn
  • Validierung der Ergebnisse (MSE)

Logistische Regression mit statsmodels:

  • Verwendung von statsmodels für statistische Modelle
  • Modellbau und Validierung
  • Grundlagen der logistischen Regression
  • Ergebnisvalidierung

Entscheidungsbaum mit scikit-learn:

  • Datenaufteilung, Modellbau und Validierung
  • Grundlagen des Entscheidungsbaums
  • Implementierung in Python
  • Validierung der Ergebnisse (u.a. Verwirrungsmatrix, Sensitivität, Genauigkeit)
  • Anpassung von Hyperparametern

Ensemblemethoden (+ AdaBoost):

  • Erstellung und Training von Ensembles mit scikit-learn
  • Bagging und Boosting
  • Grundlagen von AdaBoost für Klassifikation und Regression
  • Implementierung und Validierung

Random Forest:

  • Datenaufteilung, Modellbau und Validierung
  • Grundlagen des Random-Forest-Algorithmus
  • Validierung der Ergebnisse
  • Out-of-bag error
  • Random Forest für Regression
  • Anpassung von Hyperparametern

Weitere Algorithmen im Überblick:

  • Einführung in K-nearest Neighbor und einfache neuronale Netzwerke (MLP) mit scikit-learn
  • Implementierung und Validierung
  • Anwendung weiterer Algorithmen mit scikit-learn

Grid Search & Cross Validation:

  • Kreuzvalidierung und Grid Search mit scikit-learn
  • Automatisierte Suche nach Hyperparametern
  • Training des finalen Modells nach Kreuzvalidierung

Clustering (K-Means, DBSCAN):

  • Erstellung und Validierung von Cluster-Modellen
  • Grundlagen von K-Means und DBSCAN
  • Implementierung und Validierung

Abschluss und Fallstudie:

  • Auswahl des geeigneten Algorithmus
  • Visualisierung von Entscheidungsgrenzen
  • Fallstudie zur Wiederholung und Diskussion
Zielgruppe:
ZielgruppeDie Weiterbildung zum Data Scientist, die über einen Zeitraum von fünf Tagen stattfindet, richtet sich an Personen, die Interesse daran haben, Python zu erlernen, um Datenanalysen durchzuführen. Neben einer Einführung in Python werden in diesem Kurs auch Grundlagen des Maschinenlernens behandelt.VoraussetzungenUnser Data Science Bootcamp erfordert keine vorherigen Kenntnisse in Python. Es ist jedoch wichtig, dass die Teilnehmer über Grundkenntnisse in einer anderen Programmiersprache verfügen und wissen, was eine Variable ist, wie man einer Variable einen Wert zuweist und was Funktionen und for-Schleifen sind.

Grundkenntnisse in Statistik sind für die Data Mining Weiterbildung erforderlich. Es ist wichtig, dass die Teilnehmer wissen, was ein Mittelwert, Median, Normalverteilung und Standardabweichung sind. Da gelegentlich mathematische Formeln verwendet werden, sollten die Teilnehmer mit mathematischen Symbolen wie dem Integral, dem Summenzeichen und Konzepten wie Funktionen, Ableitungen und der Exponentialfunktion vertraut sein. Wir verwenden auch logische Operatoren, daher sind Kenntnisse der booleschen Algebra mit den Operatoren Nicht-Und-Oder sehr hilfreich.

Die Teilnehmer haben in der Regel bereits mit Daten in einer BI-Software oder in Excel gearbeitet und sind daher mit einfachen Berechnungen vertraut, die auf Daten angewendet werden können (z.B. Berechnung der Summe einer Spalte).

Die Schulungssprache ist Deutsch. Da die Dokumentation von Python und die Fachbegriffe im Bereich Machine Learning meistens auf Englisch sind, werden die Folien im Seminar auf Englisch gehalten. Grundlegende Englischkenntnisse zum Lesen von Texten sind daher sehr hilfreich.
Nach unten
Nach oben
Wir setzen Analyse-Cookies ein, um Ihre Zufriedenheit bei der Nutzung unserer Webseite zu verbessern. Diese Cookies werden nicht automatisiert gesetzt. Wenn Sie mit dem Einsatz dieser Cookies einverstanden sind, klicken Sie bitte auf Akzeptieren. Weitere Informationen finden Sie hier.
Akzeptieren Nicht akzeptieren









Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha



Bei der Verarbeitung Ihrer personenbezogenen Daten im Zusammenhang mit der Kontaktfunktion beachten wir die gesetzlichen Bestimmungen. Unsere ausführlichen Datenschutzinformationen finden Sie hier. Bei der Kontakt-Funktion erhobene Daten werden nur an den jeweiligen Anbieter weitergeleitet und sind nötig, damit der Anbieter auf Ihr Anliegen reagieren kann.







Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha