Seminare
Seminare

Machine Learning Bootcamp in R

Seminar - Essential Data Science Training GmbH

Der 5-tägige  Machine Learning Bootcamp in R vermittelt in einzeln buchbaren Modulen Kenntnisse im überwachten maschinellen Lernen (engl. supervised machine learning) in Modul 1 und im unüberwachten maschinellen Lernen (engl. unsupervised machine learning) in Modul 2, sowie praktisches Wissen zum interpretierbaren maschinellen Lernen in Modul 3. Für die Anwendungsbeispiele und praktische Übungsaufgaben kommt die statistische Software R zum Einsatz.

Ziel: Vermittlung von Kenntnissen zur Anpassung und Verbesserung von Vorhersagemodellen, zum Auffinden von Strukturen in den Daten und zur Interpretation von Algorithmen und Methoden aus dem Bereich des maschinellen Lernen mit praktischen Beispielen in R. Dies soll es den Teilnehmern erleichtern, in ihrem Arbeitsalltag eigene Vorhersagemodelle zu optimieren und Projekte zielgerichtet bearbeiten zu können, ohne sich tagelang selber in bestimmte Themen einarbeiten zu müssen. Zudem werden in den einzelnen Themenblöcken hilfreiche Zusatzpakete in R empfohlen, deren Nutzung oft unnötige Programmierarbeit, zusätzliche Recherchen und Anfängerfehler ersparen können.

Termin Ort Preis*
14.10.2024- 18.10.2024 online 2.380,00
auf Anfrage online auf Anfrage
auf Anfrage auf Anfrage auf Anfrage
*Alle Preise verstehen sich inkl. MwSt.

Detaillierte Informationen zum Seminar

Inhalte:

Modul 1: Supervised Machine Learning in R (3-tägig)

Themenschwerpunkte Teil 1: Einführung in Machine Learning und Predictive Modeling

Kursteilnehmer sollen mit den wichtigsten Konzepten und Begriffen des maschinellen Lernens vertraut gemacht werden, sowie erste einfache überwachte Lernmodelle trainieren und evaluieren. Folgende Themen werden behandelt:

  • Allgemeine Fragestellungen im maschinellen Lernen (Regression, Klassifikation, Clustering, …)

  • Einführung allgemeiner Begriffe (Verlustfunktion, Risikominimierung, Overfitting, Hyper- und Modelparameter, Training- und Testdaten, …)

  • Lineare und Logistische Regression aus der Perspektive des maschinellen Lernens

  • K-nächste Nachbarn Verfahren

  • Wichtige Evaluationmaße für Regression und Klassifikation und deren Eigenschaften

  • Resampling Methoden (Kreuzvalidierung, Bootstrap, …) und deren Vor- und Nachteile

Themenschwerpunkte Teil 2: Praktisches Machine Learning - Evaluation und Tuning

Es werden verschiedene Algorithmen des überwachten maschinellen Lernens eingeführt. Dabei werden Vor- und Nachteile der Modelle diskutiert. Zudem werden weitere fortgeschrittene Konzepte vermittelt um praktische Probleme besser und effizienter lösen zu können. Folgende Themen werden behandelt:

  • Funktionsweise wichtiger Machine Learning Algorithmen:

    • Regressions- und Klassifikationsbäume

    • Random Forests, ggf. Ausblick auf (Gradienten) Boosting 

  • Hyperparameter Optimierung (Zufallssuche und Gittersuche)

  • Genestete Kreuzvalidierung zur optimalen Modellwahl

  • Fallstricke und praxisrelevante Tipps bei der Modell-Evaluation und Modellwahl

Themenschwerpunkte Teil 3: Machine Learning Pipelines, Datenvorverarbeitung und Feature Engineering

Die Kursteilnehmer lernen praktische Methoden kennen, um häufig auftretende Probleme und Herausforderungen in Daten zu lösen und komplizierte machine learning pipelines anzuwenden. Folgende Themen werden behandelt:

  • Einfache Vorverarbeitungsmethoden (z.B. konstante und gedoppelte Feature identifizieren und entfernen)

  • Feature Transformationen (Skalierung, Zentrierung, ...)

  • Umgang mit kategorialen Features (Dummy und Impact Kodierung)

  • Fehlende Werte und Imputation

  • Unbalancierte Daten (Over/Undersampling)

  • Ausblick: Automatic Machine Learning

Voraussetzungen:

  • Kenntnisse in R und Datenanalyse / Statistik

Modul 2: Unsupervised Learning in R (1-tägig)

Während beim überwachten maschinellen Lernen (engl. supervised machine learning) Vorhersagemodelle und das Erstellen akkurater Prognosen für eine bestimmte Zielgröße im Vordergrund ist, steht im unüberwachten maschinellen Lernen (engl. unsupervised machine learning) das Auffinden von Strukturen und Erkennen von Mustern in den Daten (ohne Kenntnisse über die Zielgröße) im Vordergrund. Hauptkomponentenanalyse (PCA) und Clusteranalyse sind bekannte Verfahren aus dem Bereich des Unsupervised Machine Learning und werden in diesem Kurs ausführlich behandelt. 

Die Themenschwerpunkte sind:

  • Clusteranalyse - Auffinden von Gruppen bzw. Ähnlichkeitsstrukturen in Daten:

    • Hierarchische Clusteranalyse: Distanzmaße für Beobachtungen und Cluster (Linkage-Methoden), Dendrogramme und deren Interpretation

    • Partitionierende Clusteralgorithmen: k-Means, k-Median, k-Medoids

    • Kennzahlen für die Evaluation der Ergebnisse von Clusteralgorithmen (bzw. Indizes zur Clustervalidierung).

    • Eigenschaften, Vergleich, sowie Vor- und Nachteile verschiedener Clusterverfahren

  • Dimensionsreduktion mittels Hauptkomponentenanalyse (PCA).

Voraussetzungen:

  • Kenntnisse in R und Datenanalyse / Statistik

Modul 3: Interpretable Machine Learning in R (1-tägig)

Machine Learning Modelle werden oft als Blackbox bezeichnet, da ihre Vorhersagen üblicherweise nicht nachvollziehbar sind. Teilnehmer lernen die wichtigsten modell-agnostischen Methoden aus dem Bereich des interpretierbaren maschinellen Lernen (auch eXplainable Artificial Intelligence bzw. XAI genannt) um Vorhersagen von Modellen besser verstehen zu können. Der Fokus der Anwendungsbeispiele liegt auf Modelle für tabulare Daten. Die 

Themenschwerpunkte sind:

  • Globale und lokale Interpretationsmethoden

  • Permutation feature importance um die Wichtigkeit von Variablen zu quantifizieren

  • Partial dependence (PD) plots um den erwarteten Variablen-Effekt zu visualisieren

  • Individual conditional expectation (ICE) plots um den Variablen-Effekt einzelner Beobachtungen zu visualisieren

  • Überblick über weitere Methoden wie LIME und Shapley values.

  • Diskussion allgemeiner Fallstricke im bei der Anwendung von Machine Learning.

Voraussetzungen:

  • Kenntnisse in R und Machine Learning

Technische Voraussetzungen:

Allgemeine Kursinformationen:

Nach unten
Nach oben
Wir setzen Analyse-Cookies ein, um Ihre Zufriedenheit bei der Nutzung unserer Webseite zu verbessern. Diese Cookies werden nicht automatisiert gesetzt. Wenn Sie mit dem Einsatz dieser Cookies einverstanden sind, klicken Sie bitte auf Akzeptieren. Weitere Informationen finden Sie hier.
Akzeptieren Nicht akzeptieren









Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha



Bei der Verarbeitung Ihrer personenbezogenen Daten im Zusammenhang mit der Kontaktfunktion beachten wir die gesetzlichen Bestimmungen. Unsere ausführlichen Datenschutzinformationen finden Sie hier. Bei der Kontakt-Funktion erhobene Daten werden nur an den jeweiligen Anbieter weitergeleitet und sind nötig, damit der Anbieter auf Ihr Anliegen reagieren kann.







Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha