Der einfache Weg zum Maschinenlernen: DataRobot Auto ML Tutorial

Find AI Tools
No difficulty
No complicated process
Find ai tools

Der einfache Weg zum Maschinenlernen: DataRobot Auto ML Tutorial

Inhaltsverzeichnis

  1. Einleitung: Was ist DataRobot und wofür wird es verwendet?
  2. Schritt 0: Modellierungsdaten vorbereiten (optional)
  3. Schritt 1: Bei DataRobot anmelden
  4. Schritt 2: Daten in DataRobot importieren
  5. Schritt 3: Zielvariable eingeben
  6. Schritt 4: Modellierungsmodus wählen
  7. Schritt 5: Zur Datenseite gehen
  8. Schritt 6: Datenqualitätsbewertung durchführen
  9. Schritt 7: Features wählen
  10. Schritt 8: Feature-Liste erstellen
  11. Schritt 9: Erstellte Feature-Liste überprüfen
  12. Schritt 10: Feature Engineering durchführen
  13. Schritt 11: Modelle auswählen
  14. Schritt 12: Feature-Liste auswählen
  15. Schritt 13: Stichprobengröße ändern (optional)
  16. Schritt 14: Kreuzvalidierungsausführungen wählen (optional)
  17. Schritt 15: Modell hinzufügen
  18. Schritt 16: Modellleistungsmetrik ändern (optional)
  19. Schritt 17: Modellbeschreibung
  20. Schritt 18: Modellbewertung
  21. Schritt 19: Modelltuning
  22. Schritt 20: Holdout entsperren
  23. Schritt 21: Feature-Importanz überprüfen
  24. Schritt 22: Geschwindigkeit vs. Genauigkeit betrachten
  25. Schritt 23: Modellvergleich
  26. Schritt 24: Modellauswahl
  27. Schritt 25: Vorhersagen treffen
  28. Schritt 26: Vorhersagen herunterladen

🤖 Wie man DataRobot für maschinelles Lernen verwendet

Machine Learning ist heute eine der wichtigsten Technologien für Unternehmen und Organisationen auf der ganzen Welt. Es ermöglicht die automatische Analyse großer Datenmengen und die Erstellung von Modellen, die auf diesen Daten basieren. DataRobot ist eine automatische Machine Learning-Plattform, die Unternehmen dabei hilft, effektive Machine Learning-Modelle zu erstellen und zu implementieren.

1. Einleitung: Was ist DataRobot und wofür wird es verwendet?

DataRobot ist eine führende Plattform für automatisiertes Machine Learning. Es bietet Unternehmen eine umfassende Lösung zur Entwicklung, Implementierung und Optimierung von Machine Learning-Modellen. Mit DataRobot können Unternehmen ohne umfangreiche Kenntnisse in den Bereichen Statistik und maschinelles Lernen leistungsfähige Modelle erstellen, die auf ihren Daten basieren.

DataRobot bietet verschiedene Funktionen, darunter automatische Feature-Engineering, Modellbewertung und Interpretation, Modellauswahl und Finetuning. Die Plattform unterstützt eine Vielzahl von Anwendungsfällen, darunter Regression, Klassifikation, Zeitreihenprognose und Anomalieerkennung.

2. Schritt 0: Modellierungsdaten vorbereiten (optional)

Bevor Sie mit dem Einsatz von DataRobot beginnen, müssen Sie Ihre Modellierungsdaten vorbereiten. Dieser Schritt ist optional, da DataRobot auch mit verschiedenen öffentlichen Datensätzen arbeiten kann.

Wenn Sie Ihre eigenen Daten verwenden möchten, müssen Sie diese in einem geeigneten Format vorbereiten. Dazu gehört das Entfernen von fehlenden Werten, das Codieren kategorischer Variablen und das Skalieren von numerischen Variablen.

3. Schritt 1: Bei DataRobot anmelden

Der erste Schritt bei der Verwendung von DataRobot besteht darin, sich bei der Plattform anzumelden. Gehen Sie zur DataRobot-Website und melden Sie sich mit Ihren Anmeldedaten an. Wenn Sie noch kein Konto haben, können Sie eines erstellen.

Nach der Anmeldung gelangen Sie zur Startseite von DataRobot. Hier finden Sie einen Überblick über Ihre Projekte, Modelle und Daten.

4. Schritt 2: Daten in DataRobot importieren

Um mit der Erstellung eines Machine Learning-Modells zu beginnen, müssen Sie Ihre Daten in DataRobot importieren. DataRobot unterstützt verschiedene Datenquellen, darunter CSV-Dateien, Datenbanken und Cloud-Speicher.

Klicken Sie auf den Button "Daten importieren" und wählen Sie die entsprechende Datenquelle aus. Befolgen Sie die Anweisungen, um Ihre Daten erfolgreich in DataRobot zu importieren.

5. Schritt 3: Zielvariable eingeben

Nachdem Ihre Daten erfolgreich importiert wurden, müssen Sie die Zielvariable für Ihr Modell festlegen. Die Zielvariable ist die Variable, die Sie vorhersagen möchten. In DataRobot können Sie zwischen verschiedenen Aufgaben wie Regression und Klassifikation wählen.

Wählen Sie die richtige Aufgabe und geben Sie die Zielvariable ein. DataRobot wird automatisch die passenden Modelle und Algorithmen für Ihre Aufgabe auswählen.

6. Schritt 4: Modellierungsmodus wählen

DataRobot bietet verschiedene Modellierungsmodi, die Sie wählen können, je nach Ihren Anforderungen. Sie können zwischen Autopilot, Quick, Manual und Comprehensive wählen.

  • Autopilot: DataRobot wählt automatisch die besten Modelle für Ihre Aufgabe aus.
  • Quick: DataRobot führt ausgewählte Modelle mit der maximalen Stichprobengröße aus.
  • Manual: Sie wählen manuell die Modelle aus, die Sie ausführen möchten.
  • Comprehensive: DataRobot führt alle Modelle in der Repository aus, was viel Zeit in Anspruch nehmen kann.

Wählen Sie den Modellierungsmodus, der Ihren Anforderungen am besten entspricht.

7. Schritt 5: Zur Datenseite gehen

Nachdem Sie den Modellierungsmodus gewählt haben, klicken Sie auf "Start" und DataRobot beginnt mit der Auswertung Ihrer Daten. Auf der rechten Seite des Bildschirms sehen Sie den Fortschritt der Auswertung.

Nach Abschluss der Auswertung können Sie zwischen "Go to Repository" und "Dismiss" wählen. Wählen Sie "Dismiss", um mit der Betrachtung der Features fortzufahren.

8. Schritt 6: Datenqualitätsbewertung durchführen

Auf der Datenübersichtsseite können Sie eine Zusammenfassung Ihrer Daten anzeigen. Sie sehen Informationen wie den Datensatznamen, die Anzahl der Features, die Anzahl der Datensätze und die Anzahl der fehlenden Werte für jedes Feature.

Sie können die Features überprüfen und potenzielle Probleme mit der Datenqualität identifizieren. DataRobot zeigt Warnungen für mögliche Probleme wie Target Leakage und Ausreißer an. Basierend auf Ihren Kenntnissen über das Problem und den spezifischen Daten können Sie entscheiden, ob Sie diese Warnungen ignorieren oder Maßnahmen ergreifen möchten.

Die Datenqualitätswarnungen beeinträchtigen nicht den Fortschritt des Modellierungsprozesses, helfen Ihnen jedoch dabei, potenzielle Probleme schnell zu erkennen.

9. Schritt 7: Features wählen

Nachdem Sie die Datenqualität überprüft haben, können Sie die Features auswählen, die Sie für Ihr Modell verwenden möchten. Klicken Sie auf das Kontrollkästchen neben dem Namen des Features, um es auszuwählen. Sie können auch Features abwählen, die Sie nicht in Ihr Modell aufnehmen möchten.

Durch die Auswahl spezifischer Features können Sie das Modelltraining beschleunigen und die Ergebnisse verbessern.

10. Schritt 8: Feature-Liste erstellen

Nachdem Sie die gewünschten Features ausgewählt haben, können Sie eine Feature-Liste erstellen. Eine Feature-Liste ist eine Gruppe von Features, die Sie für das Modell ausgewählt haben.

Klicken Sie auf den orangefarbenen Button "+ Neue Feature-Liste erstellen", geben Sie der Liste einen Namen und klicken Sie auf "Feature-Liste erstellen". Die erstellte Feature-Liste wird als Standard für die weiteren Schritte verwendet.

11. Schritt 9: Erstellte Feature-Liste überprüfen

Nachdem Sie die Feature-Liste erstellt haben, überprüfen Sie, ob die Änderungen in der Feature-Liste übernommen wurden. Stellen Sie sicher, dass die Features, die Sie ausgewählt haben, in der Liste angezeigt werden und die unerwünschten Features ausgeschlossen sind.

Eine gut gewählte Feature-Liste ist entscheidend für die Leistung des Modells.

12. Schritt 10: Feature Engineering durchführen

Feature Engineering ist der Prozess des Erstellens neuer Features aus vorhandenen Daten. Dieser Schritt ist optional und kann durchgeführt werden, um die Leistung des Modells weiter zu verbessern.

Klicken Sie auf das orangefarbene Menü-Symbol und wählen Sie "Aktionen", dann "F(x)-Transformation erstellen". Hier können Sie eine transformierte Funktion erstellen, indem Sie eine Formel eingeben.

Nachdem Sie die Formel eingegeben haben, klicken Sie auf "Erstellen". Das neue Feature wird unter dem ursprünglichen Feature angezeigt. Überprüfen Sie, ob das neue Feature keine Warnungen zur Datenqualität aufweist.

13. Schritt 11: Modelle auswählen

DataRobot bietet eine Vielzahl von Modellen und Algorithmen, aus denen Sie wählen können. Gehen Sie zu "Modelle" und klicken Sie auf "+ Neues Modell hinzufügen".

Wählen Sie unter "Modell auswählen" den gewünschten Modelltyp aus. Sie können auch nach einem bestimmten Modell suchen, indem Sie den Namen eingeben.

Wählen Sie das gewünschte Modell aus und klicken Sie auf "Modell hinzufügen". Das Modell wird zur Rangliste hinzugefügt und der Trainingsprozess beginnt.

14. Schritt 12: Feature-Liste auswählen

Unter "Feature-Liste ausführen" wählen Sie die zuvor erstellte Feature-Liste aus. Dies ist die Liste der Prädiktoren, die für das Modell verwendet werden.

Die Auswahl einer geeigneten Feature-Liste kann die Modellgenauigkeit verbessern und Overfitting verhindern.

15. Schritt 13: Stichprobengröße ändern (optional)

DataRobot teilt Ihre Daten standardmäßig in 80% für das Training und 20% für das Testen. Sie können die Stichprobengröße ändern, indem Sie auf das orangefarbene "+"-Symbol unter "Stichprobengröße" klicken.

Ändern Sie die Stichprobengröße nach Ihren Anforderungen und klicken Sie auf "Übernehmen", um die Änderungen zu speichern.

16. Schritt 14: Kreuzvalidierungsausführungen wählen (optional)

Unter "CV-Ausführungen" können Sie wählen, ob die Kreuzvalidierung für eine oder alle fünf Faltungen durchgeführt werden soll. Standardmäßig wird eine Faltung verwendet.

Wählen Sie die gewünschte Anzahl der Faltungen und klicken Sie auf "Übernehmen", um die Änderungen zu speichern.

17. Schritt 15: Modell hinzufügen

Nachdem Sie alle Modelloptionen ausgewählt haben, klicken Sie auf das orangefarbene "Modell hinzufügen"-Symbol. Das Modell wird zur Rangliste hinzugefügt und der Trainingsprozess beginnt.

Der Fortschritt des Trainingsprozesses wird auf der rechten Seite des Bildschirms angezeigt. Sie können neue Modelle hinzufügen, indem Sie auf den orangefarbenen Pfeil unter "Modell auswählen" klicken.

18. Schritt 16: Modellleistungsmetrik ändern (optional)

Um die Modellleistungsmetrik zu ändern, klicken Sie auf das Schließen-Symbol neben dem orangefarbenen "Modell hinzufügen"-Symbol. Die Metrik ist standardmäßig auf LogLoss eingestellt.

Klicken Sie auf "Auswählen", um eine andere Metrik wie AUC auszuwählen. Die Ergebnisse der Modellbewertung werden entsprechend aktualisiert.

19. Schritt 17: Modellbeschreibung

Nach Abschluss des Trainingsprozesses können Sie auf den Namen des Modells klicken, um weitere Informationen zu erhalten. Die Beschreibung des Modells enthält Informationen zum Trainings- und Vorhersageprozess.

Sie können den Modell-Blueprint, Informationen zum Modell und Koeffizienten, die Architektur des neuronalen Netzwerks und das Modellprotokoll überprüfen.

20. Schritt 18: Modellbewertung

Die Evaluation des Modells gibt Einblick in die Leistung des Modells. Sie können verschiedene Metriken wie Lift Chart, ROC Curve, Confusion Matrix und Model Performance Metrics überprüfen.

Die Lift Chart zeigt die Verbesserung der Zielvariablenprognose im Vergleich zu einer zufälligen Prognose. Die ROC Curve zeigt die Leistung des Modells bei verschiedenen Schwellenwerten. Die Confusion Matrix zeigt die Anzahl der korrekten und falschen Vorhersagen.

Die Modellleistungsmetrik gibt Aufschluss über die Genauigkeit, Sensitivität, Präzision und andere Leistungsmetriken des Modells.

21. Schritt 19: Modelltuning

Wenn Sie die Hyperparameter des Modells anpassen möchten, können Sie zum Modelltuning gehen. Klicken Sie auf "Bewerten" und dann auf "Erweiterte Anpassung".

Hier können Sie die aktuellen Hyperparameterwerte ändern und neue Werte eingeben, um das Modell anzupassen. Sie können auch Hyperparameter-Suchen verwenden, um die besten Werte automatisch zu finden.

22. Schritt 20: Holdout entsperren

Nachdem Sie alle Modelle abgeschlossen haben, können Sie den Holdout-Satz entsperren. Gehen Sie zurück zur Rangliste der Modelle und klicken Sie auf das orangefarbene "Holdout-Sperre aufheben"-Symbol.

Der Holdout-Satz zeigt nun die Metriken für alle Modelle an.

23. Schritt 21: Feature-Importanz überprüfen

Unter "Modelle → Insights → Feature-Importanz" können Sie die Relevanz der Features überprüfen. DataRobot zeigt an, welche Features bei der Vorhersage am wichtigsten sind.

Die Feature-Importanz kann Ihnen helfen, die Daten besser zu verstehen und die Modelle zu optimieren.

24. Schritt 22: Geschwindigkeit vs. Genauigkeit betrachten

Unter "Modelle → Speed vs Accuracy" können Sie die Geschwindigkeit und Genauigkeit der Modelle vergleichen. DataRobot stellt eine Streudiagramm bereit, das die Zeit für 1000 Vorhersagen und die Validierungsergebnisse zeigt.

Sie können die Genauigkeit des Modells basierend auf der Vorhersagezeit bewerten.

25. Schritt 23: Modellvergleich

Der Modellvergleich ermöglicht es Ihnen, die Leistung der Modelle leicht zu vergleichen. Gehen Sie zu "Modelle → Modellvergleich" und sehen Sie sich die Zusammenfassung der Metriken an.

DataRobot zeigt die besten Werte für jede Metrik an und hilft Ihnen bei der Auswahl des besten Modells.

26. Schritt 24: Modellauswahl

Nachdem Sie den Modellvergleich durchgeführt haben, können Sie das Modell auswählen, das am besten zu Ihren Anforderungen passt. Berücksichtigen Sie dabei die Leistung des Modells auf den Validierungs-, Kreuzvalidierungs- und Holdout-Datensätzen.

Klicken Sie auf den Namen des ausgewählten Modells, um weitere Details anzuzeigen.

27. Schritt 25: Vorhersagen treffen

Sobald Sie das Modell ausgewählt haben, können Sie Vorhersagen treffen. Gehen Sie zu "Modelle → Rangliste" und klicken Sie auf den Namen des Modells.

Klicken Sie im erweiterten Bereich auf "Vorhersagen", um Vorhersagen für neue Daten zu treffen. Sie können die Vorhersageschwelle anpassen und die Daten hochladen, um Vorhersagen zu treffen.

28. Schritt 26: Vorhersagen herunterladen

Nachdem die Vorhersagen abgeschlossen sind, können Sie die Ergebnisse herunterladen. Klicken Sie auf "Vorhersagen herunterladen" und wählen Sie das gewünschte Format.

Die Vorhersagen enthalten die Zeilen-ID, die prognostizierte Wahrscheinlichkeit und das prognostizierte Label.

🎉 Highlights

  • DataRobot ist eine führende Plattform für automatisiertes Machine Learning.
  • Mit DataRobot können Unternehmen leistungsstarke Machine Learning-Modelle erstellen und implementieren.
  • DataRobot bietet Funktionen wie automatisches Feature-Engineering, Modellbewertung und Interpretation, Modellauswahl und Feinabstimmung.
  • Sie können Daten aus verschiedenen Quellen importieren und verschiedene Modellierungsmodi wählen.
  • DataRobot bietet umfangreiche Funktionen zur Modellbewertung und -optimierung.
  • Sie können Vorhersagen für neue Daten treffen und die Ergebnisse herunterladen.

FAQ

Frage: Ist DataRobot auch für kleinere Unternehmen geeignet? Antwort: Ja, DataRobot kann von Unternehmen jeder Größe verwendet werden. Es bietet flexible Pläne, die den Anforderungen kleinerer Unternehmen gerecht werden.

Frage: Bietet DataRobot Deployment-Optionen für Modelle? Antwort: Ja, DataRobot bietet Funktionen zur Bereitstellung von Modellen in Produktionsumgebungen und zur Überwachung der Modellleistung.

Frage: Kann DataRobot mit großen Datensätzen umgehen? Antwort: Ja, DataRobot kann mit großen Datensätzen umgehen und skaliert gut mit zunehmender Datenmenge.

Frage: Ist DataRobot für Anfänger geeignet? Antwort: Ja, DataRobot ist benutzerfreundlich und bietet eine intuitive Benutzeroberfläche. Es ist für Anfänger geeignet, erfordert jedoch ein grundlegendes Verständnis von Machine Learning-Konzepten.

Frage: Gibt es eine kostenlose Testversion von DataRobot? Antwort: Ja, DataRobot bietet eine kostenlose Testversion, mit der Sie die Plattform ausprobieren können.

Frage: Kann DataRobot für verschiedene Arten von Machine Learning-Aufgaben verwendet werden? Antwort: Ja, DataRobot unterstützt verschiedene Arten von Machine Learning-Aufgaben, darunter Regression, Klassifikation, Zeitreihenprognose und Anomalieerkennung.

Frage: Wer verwendet DataRobot? Antwort: DataRobot wird von einer Vielzahl von Organisationen und Branchen eingesetzt, darunter Finanzdienstleistungen, Gesundheitswesen, Einzelhandel und Technologie.

Frage: Bietet DataRobot Funktionen zur Modellinterpretation? Antwort: Ja, DataRobot bietet Funktionen zur Modellinterpretation, einschließlich Feature-Importanz und Koeffizientenanalyse.

Frage: Kann DataRobot mit benutzerdefinierten Algorithmen verwendet werden? Antwort: Ja, DataRobot unterstützt die Integration benutzerdefinierter Algorithmen und Modelle.

Frage: Gibt es Schulungsmaterialien und Ressourcen für DataRobot? Antwort: Ja, DataRobot bietet eine Reihe von Schulungsmaterialien, Dokumentation und Community-Ressourcen, um Benutzer bei der Verwendung der Plattform zu unterstützen.

Ressourcen

Most people like

Are you spending too much time looking for ai tools?
App rating
4.9
AI Tools
100k+
Trusted Users
5000+
WHY YOU SHOULD CHOOSE TOOLIFY

TOOLIFY is the best ai tool source.