Seminare
Seminare

Data Mining mit R (Online)

Seminar - DHL Data Science Seminare GmbH

Der dreitägige R Kurs Data Mining mit R führt in die Grundlagen und die Verwendung von R im Data Mining ein. Die R Schulung Data Mining mit R vermittelt nicht nur das theoretische Verständnis, sondern auch die praktische Anwendung für wichtige der im Data Mining eingesetzten Verfahren. Sie lernen grundlegende Schritte mit R im Bereich Data Science, um selbständig erste Data Mining Analysen durchzuführen.  
Ein Schwerpunkt des R Kurses ist das für Data Science entwickelte R-Paket data.tables. Die mit diesem Paket erzeugten data frames entsprechen den in der statistischen Programmiersprache R üblichen data.frames und ermöglichen einen wesentlich höheren Datendurchsatz. Für die Visualisierung der Ergebnisse wird das R-Paket ggplot2 eingesetzt.
 
Sie werden auch erfahren, wie weitergehende Data Mining Algorithmen und Data Science Methoden in R zu finden sind, um das Wissen nach dem Seminar fortlaufend erweitern zu können. Sie erhalten einen Überblick über verwendete Algorithmen aus dem Machine Learning, welche in R umgesetzt werden. Sie arbeiten überwiegend selbständig mit Unterstützung des Trainers, um das Erlernte in den Übungen direkt umzusetzen und anzuwenden.
 
Feedbacks unserer Teilnehmer: https://www.provenexpert.com/dhl-data-science-seminare-gmbh/
Termin Ort Preis*
firmenintern auf Anfrage auf Anfrage
*Alle Preise verstehen sich inkl. MwSt.

Detaillierte Informationen zum Seminar

Inhalte:
  • Grundkenntnisse für Data Mining mit R
    • Hintergrund zu R und RStudio
    • Pakete installieren und laden
    • Datenstrukturen in R
    • Hilfe und weiterführende Informationen finden
    • Wie unterscheidet sich R von anderen Programmiersprachen
  • Das Data Mining Paket data.table
    • Struktur und Besonderheiten von data.table im Vergleich zum data.frame
    • Ähnlichkeit eines data.tables zu SQL Abfragen
    • Daten nach Zeilen und Spaltennamen abfragen
    • Berechnungen direkt auf Spalten durchführen
    • Abfragen gruppieren
  • Daten einlesen und konvertieren
    • Das Arbeitsverzeichnis zum Einlesen von Daten setzen
    • Daten aus verschiedenen Quellen einlesen (Websiten, txt, csv)
    • Daten aus fremden Quellen einlesen
    • fread(), um effizient große Datenmengen einzulesen
    • Daten als .RData speichern und laden
    • Abfragen aus einer Datenbank (SQLite)
  • Data handling (data.table)
    • Eine Spalte erzeugen, löschen, ändern
    • Zwischen Datentypen konvertieren
    • lapply() und die Anwendung in einem data.table (mit .SD und .SDcols)
  • Visualisierung von Daten mit dem Paket ggplot2
    • Grammar of Graphics und die grundlegende Idee dahinter
    • Scatterplot, Linienplot
    • Histogramm
    • Kerndichteschätzer
    • Barplot
    • Speichern von Grafiken
    • Darstellung (Größe der Datenpunkte, Farbe, Gruppierung) variable oder fest ändern
    • Subplots erzeugen (Facetting)
  • Grundlegende Statistiken
    • Deskriptive Statistiken
    • Korrelationen (Spearman, Pearson)
    • Zufallszahlen aus verschiedenen Verteilungen erzeugen
  • Fortgeschrittene Wege, ein data.table zu benutzen
    • Der := Operator in data.table zum Umformen von Daten
    • Eine Funktion auf eine Gruppe von Daten anwenden
    • Daten aggregieren
    • Filtern von Datensätzen anhand selbst gewählter Attribute
    • Ersetzen von fehlenden Werten
  • Control Flows
    • Schreiben einer eigenen Funktion
    • If und if-else
    • For Schleifen
    • While Schleife
  • Überblick über Machine Learning
    • Einführung in Machine Learning (Supervised – Unsupervised Learning. Overfitting, cross-validation)
    • Grundlegendes Konzept von den Algorithmen Support Vector Machine (SVM), Random Forest und K-means
    • Modelle der Algorithmen in R erstellen
    • Ergebnisse validieren
  • Detaillierte Umsetzung der Algorithmen Entscheidungsbaum und Logistische Regression
    • Grundlagen des Algorithmus
    • Train-Test Split der Daten
    • Ein Model in R erstellen
    • Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
    • Hyperparameter im Training
    • cross-validation
Dauer/zeitlicher Ablauf:
3 Tage, 9-17 Uhr
Ziele/Bildungsabschluss:

Die Teilnehmer erhalten mit dem R Kurs einen Überblick über die statistische Programmiersprache R und die Entwicklungsumgebung RStudio und können erste Analysen mit R im Data Mining umsetzen. Die R Schulung zielt darauf, die Einstiegshürde für die Anwendung von R im Data Science zu nehmen, indem die Teilnehmer überwiegend mit den eigenen Laptops und der Unterstützung des Trainers in R arbeiten, um das Erlernte direkt umzusetzen und anzuwenden. Ein selbstständiges Arbeiten als data scientist wird ermöglicht, indem mit dem R Kurs die wesentlichen Konzepte von R vermittelt werden. Möglichkeiten, weitergehende Algorithmen und Methoden zu finden, werden aufgezeigt, um das Erlernte nach dem Seminar durch stetige Anwendung zu erweitern. Ein Überblick über bekannte Algorithmen im Machine Learning wird gegeben und die Teilnehmer des R Kurses können die verschiedenen Algorithmen voneinander differenzieren und in R benutzen.

Ziel der R Schulung ist der erfolgreiche Umgang mit der Syntax in R für die Datenanalyse. Das Seminar hat daher zahlreiche praktische Übungen, welche selbstständig mit Unterstützung des Trainers bearbeitet werden, um die Kenntnisse in R dahingehend zu schulen, dass eine praktische Umsetzung und ein selbständiges Arbeiten im Bereich Data Science ermöglicht wird. Ein durchgehendes Datenbeispiel wird verwendet, um die wichtigsten Bibliotheken zu behandeln, welche in umfangreichen Übungen trainiert werden. Die Praxisbeispiele und Übungsaufgaben erfolgen mit der statistischen Programmiersprache R und der Entwicklungsumgebung RStudio.

Teilnahmevoraussetzungen:

In dem R-Kurs werden grundlegende Kenntnisse in R nicht vorausgesetzt, sie wären jedoch hilfreich. Alternativ wäre auch die Erfahrung in einer anderen Programmiersprache sehr förderlich, um Konzepte wie Variable, Variablenzuweisung, Funktionsaufruf und den Unterschied zwischen Ganzzahl und Dezimalzahl bereits zu kennen. Sie können dazu den Vorbereitungskurs Einführung in die Programmierung mit R besuchen. Ein Basiswissen von grundlegenden statistischen Begriffen wie Mittelwert, Median, Perzentil, Normalverteilung, lineare Regression ist sehr empfehlenswert, um den Inhalten besser folgen zu können.

Technische Voraussetzungen:

Mit der heutigen Technik kommt das Präsenz-Seminar zu Ihnen an den Arbeitsplatz bzw. ins Home-Office. Sie nehmen an einem Live-Online-Training teil, der vom Ablauf und der Qualität unseren Präsenztrainings entspricht. Der Dozent führt in die Themen ein, beantwortet die Fragen der Teilnehmer und geht in den Übungsrunden auf jeden Teilnehmer persönlich ein. Bei Fragen oder Problemen können Sie dem Dozenten Ihren Bildschirm freigeben.

Ein Teilnehmer unserer Kurse schreibt: „Obwohl ich wegen Online Seminar sehr skeptisch gegenüber stand, kann ich dem Dozenten wirklich nur dafür gratulieren, wie gut dieser dieses Seminar umgesetzt hat. Dies könnte man wohl auch nicht besser bei einer Vorort-Schulung machen. Daher kann ich dieses Seminar nur wirklich sehr empfehlen.“ Lesen Sie weitere Rezensionen unserer Teilnehmer unter https://www.provenexpert.com/dhl-data-science-seminare-gmbh/.

Alles, was Sie brauchen, ist ein PC oder Laptop mit folgenden Merkmalen:

  • Es ist die Statistik-Software installiert, mit der der Kurs durchgeführt wird. Sie erhalten dazu nach der Anmeldung eine detaillierte Installationsanleitung.
  • Der Laptop hat Zugang zum Internet mit einer empfohlenen Bandbreite von mindestens 1-2 MBit/s.
  • Entweder installieren Sie unsere Webinar-Software oder Sie nehmen an dem Webinar mit einem Internet-Browser (Google Chrome oder Firefox) teil.
  • Testen Sie die Funktionsfähigkeit von Kamera, Mikrofon und Lautsprecher Ihres PCs/Laptops.
  • Von Vorteil wäre die Verwendung von zwei Geräten/Monitoren: Auf dem einen Gerät/Monitor (z. B. Laptop oder Tablet) sehen Sie die Präsentation des Dozenten oder Unterrichtsmaterialien. Auf dem anderen Gerät/Monitor (z. B. PC oder Laptop) können Sie parallel dazu das Gelernte direkt anwenden und Übungsaufgaben lösen.

Bei unseren Präsenzveranstaltungen nehmen Sie bitte einen Laptop mit (Sie erhalten eine Installationsanleitung für die erforderliche Software). Gegen eine Gebühr können Sie einen fertig eingerichteten Laptop bei uns mieten.

Bei Inhouse-Seminaren werden Seminarraum und technische Geräte (Beamer, Leinwand, PCs/Laptops) vom Kunden zur Verfügung gestellt. Gegen Aufpreis können wir bundesweit in allen größeren Städten einen Seminarraum mit den technischen Geräten organisieren. Auf Wunsch können wir auch ein Online-Firmenseminar durchführen.

Lehrgangsverlauf/Methoden:

offene 3-Tages-Schulung mit 2-10 Teilnehmer
täglicher Unterricht 9-17 Uhr mit drei Pausen

Material:

Präsenztrainings

  • Seminarräume in zentraler Lage
  • gedruckte Schulungsunterlagen 
  • persönliche Betreuung der Teilnehmer in den Übungsblöcken
  • Getränke in den Pausen
  • ein Zertifikat mit den Schulungsinhalten


Live-Online-Trainings

  • multimedialer Online-Unterricht mit Webex oder Zoom
  • umfangreiche Online-Materialien
  • persönliche Betreuung der Teilnehmer in den Übungsblöcken
  • ein Zertifikat mit den Schulungsinhalten
Förderung:
Bildungsurlaub, Bildungsscheck, Bildungsprämie, kein Bildungsgutschein
Zielgruppe:

Der R Kurs richtet sich an Datenanalysten und zukünftige Data Scientists, welche eine Vertiefung in wichtige Machine Learning Algorithmen erhalten wollen oder die die Syntax der Programmiersprache R kennenlernen wollen, um R-Skripte für Data-Mining-Analysen schreiben zu können.

Seminarkennung:
DMR
Nach unten
Nach oben
Wir setzen Analyse-Cookies ein, um Ihre Zufriedenheit bei der Nutzung unserer Webseite zu verbessern. Diese Cookies werden nicht automatisiert gesetzt. Wenn Sie mit dem Einsatz dieser Cookies einverstanden sind, klicken Sie bitte auf Akzeptieren. Weitere Informationen finden Sie hier.
Akzeptieren Nicht akzeptieren









Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha



Bei der Verarbeitung Ihrer personenbezogenen Daten im Zusammenhang mit der Kontaktfunktion beachten wir die gesetzlichen Bestimmungen. Unsere ausführlichen Datenschutzinformationen finden Sie hier. Bei der Kontakt-Funktion erhobene Daten werden nur an den jeweiligen Anbieter weitergeleitet und sind nötig, damit der Anbieter auf Ihr Anliegen reagieren kann.







Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha