Daten visualisieren mit Amazon QuickSight | AWS Projekt
Tabelle des Inhalts:
- Einführung
- Herunterladen des Datenbestands
- Speichern des Datenbestands in einem Amazon S3-Bucket
- Verbinden des S3-Buckets mit Amazon Quicksite
- Erstellung von Visualisierungen
- Informationen zur Datenquelle
- Erstellen eines QuickSite-Kontos
- Importieren des Datenbestands in QuickSite
- Erstellen der ersten Visualisierung
- Weitere Visualisierungsmöglichkeiten
Einführung
Willkommen zurück zu einer weiteren Anleitung in unserer "Build with me" -Serie. In dieser Serie werde ich Ihnen Schritt für Schritt zeigen, wie Sie ein Mini-Projekt mit AWS erstellen können. Für das heutige Projekt werden wir zwei AWS-Services verwenden: Amazon S3 und Amazon Quicksite. Wir verwenden auch einen Datensatz, der von Bright Data bereitgestellt wird und eine Liste der 50.000 meistverkauften Produkte auf Amazon.com enthält. Mein Ziel in diesem Video ist es, Ihnen Anweisungen zu geben, wie Sie AWS-Services verwenden können, um Visualisierungen aus großen Datensätzen zu erstellen. Wenn Sie gerade dabei sind, AWS Cloud zu lernen und Ihre praktischen technischen Fähigkeiten verbessern möchten, empfehle ich Ihnen, Schritt für Schritt mitzumachen und das Video nach Bedarf anzuhalten. Bevor wir beginnen, geben Sie bitte diesem Video ein "Like" und kommentieren Sie unten mit dem Satz "Lass uns gemeinsam bauen". Okay, hier ist ein Überblick darüber, was wir heute tun werden.
Herunterladen des Datenbestands
Um mit unserem Projekt zu beginnen, müssen wir einen Datensatz mit 50.000 meistverkauften Amazon-Produkten herunterladen. Sie können diesen Datensatz von meiner GitHub-Seite herunterladen. Es handelt sich um eine CSV-Datei namens "amazonbestseller.csv" und eine Json-Datei namens "manifest.json". Klicken Sie auf die entsprechenden Links und speichern Sie die Dateien in Ihrem Download-Ordner. Es ist wichtig zu erwähnen, dass dieser Datensatz von Bright Data bereitgestellt wurde. Bright Data ist ein führendes Unternehmen für Datensammlung, das öffentliche Webdaten im großen Maßstab sammelt. Normalerweise müsste ich die Daten manuell von der Amazon.com-Website abrufen und bereinigen, aber dank Bright Data haben sie uns den Datensatz zur Verfügung gestellt und den Web-Scraping-Teil für uns übernommen.
Speichern des Datenbestands in einem Amazon S3-Bucket
Nachdem wir den Datensatz heruntergeladen haben, ist der nächste Schritt, ihn in einem Amazon S3-Bucket zu speichern. Gehen Sie zur AWS Management Console und geben Sie "S3" ein, um zur S3-Konsole zu gelangen. Klicken Sie auf "Bucket erstellen" und geben Sie einen Namen für den Bucket ein. Ich werde ihn "Lucy Amazon Project" nennen, aber Sie können ihm einen beliebigen Namen geben. Laden Sie dann die heruntergeladene CSV-Datei in den Bucket hoch. Vergessen Sie nicht, auch die "manifest.json"-Datei hochzuladen. In der Datei müssen Sie den Namen Ihres Buckets eingeben. Wenn Sie all diese Schritte abgeschlossen haben, ist unser Datensatz erfolgreich in einem Amazon S3-Bucket gespeichert.
Verbinden des S3-Buckets mit Amazon Quicksite
Jetzt können wir unseren S3-Bucket mit Amazon Quicksite verbinden, um interessante Visualisierungen zu erstellen. Öffnen Sie eine neue Registerkarte und geben Sie "quicksite" ein, um zur Quicksite-Benutzeroberfläche zu gelangen. Wenn Sie noch kein Quicksite-Konto haben, können Sie eines erstellen, indem Sie auf "Anmelden" klicken und den Anweisungen folgen. Nachdem Sie Ihr Konto erstellt haben, wählen Sie Ihren S3-Bucket aus und warten Sie, bis die Einrichtung abgeschlossen ist. Sobald alles eingerichtet ist, haben wir Zugriff auf die Quicksite-Benutzeroberfläche und können mit der Erstellung von Visualisierungen beginnen.
Erstellung von Visualisierungen
In QuickSite haben Sie die Möglichkeit, verschiedene Arten von Diagrammen und Visualisierungen zu erstellen. Ziehen Sie einfach die gewünschten Datenfelder in das Diagramm und Quicksite erledigt den Rest. Sie können die Visualisierungen nach Belieben anpassen und experimentieren. Ein Beispiel für eine Visualisierung könnte die Anzeige der beliebtesten Marken basierend auf der Häufigkeit ihres Vorkommens im Datensatz sein. Sie können auch Preise vergleichen, die meistverkauften Titel analysieren oder die Verkäufer identifizieren, die die meisten Produkte haben. Die Möglichkeiten sind endlos.
Informationen zur Datenquelle
Die Daten, die wir für dieses Projekt verwenden, stammen von Bright Data. Bright Data ist ein Unternehmen für Datensammlung, das öffentliche Webdaten in großem Maßstab sammelt. Sie bieten sowohl Web-Scraping-Tools als auch fertige Datensätze an. Der von uns verwendete Datensatz enthält eine Liste der 50.000 meistverkauften Produkte auf Amazon.com. Bright Data bietet auch maßgeschneiderte Datensätze an. Wenn Sie also in Zukunft einen größeren Datensatz benötigen, empfehle ich Ihnen, sich Bright Data anzuschauen und einen Datenbestand anzufordern.
Erstellen eines QuickSite-Kontos
Bevor wir mit der eigentlichen Arbeit beginnen können, müssen Sie ein QuickSite-Konto erstellen. Gehen Sie dazu zur QuickSite-Homepage und klicken Sie auf "Anmelden". Folgen Sie den Anweisungen, um ein Konto zu erstellen. Sobald Sie angemeldet sind, können Sie mit der Verbindung Ihres S3-Buckets und der Erstellung von Visualisierungen beginnen.
Importieren des Datenbestands in QuickSite
Um den heruntergeladenen Datenbestand in QuickSite zu importieren, gehen Sie zur Daten-Registerkarte und klicken Sie auf "Neuer Datenbestand". Wählen Sie dann "S3" aus und geben Sie die URL Ihrer "manifest.json"-Datei ein. Dadurch wird QuickSite angewiesen, den entsprechenden CSV-Datensatz zu importieren. Wählen Sie dann die interaktive Tabelle als Visualisierungsoption aus und warten Sie, bis der Import abgeschlossen ist. Sobald der Import abgeschlossen ist, können Sie die importierten Datenfelder verwenden, um Ihre Visualisierungen zu erstellen.
Erstellen der ersten Visualisierung
Für unsere erste Visualisierung werden wir die beliebtesten Marken anzeigen. Ziehen Sie dazu das Datenfeld "Marke" in das Diagramm und lassen Sie QuickSite die Anzahl der Vorkommnisse zählen. Sortieren Sie die Marken in aufsteigender Reihenfolge, um die beliebtesten Marken zu identifizieren. Sie können auch andere Datenfelder wie den Preis, die Verfügbarkeit oder den Verkäufer untersuchen. Haben Sie Spaß beim Erstellen Ihrer eigenen Visualisierungen und teilen Sie sie gerne auf sozialen Medien.
Weitere Visualisierungsmöglichkeiten
QuickSite bietet viele weitere Möglichkeiten zur Erstellung von Visualisierungen. Sie können Balkendiagramme, Tortendiagramme und sogar Wortwolken erstellen. Experimentieren Sie mit verschiedenen Datenfeldern und Diagrammtypen, um interessante Erkenntnisse zu gewinnen.
Das waren die grundlegenden Schritte, um große Datensätze mit Hilfe von AWS-Services und QuickSite zu visualisieren. Wenn Sie mehr über dieses Thema erfahren möchten, empfehle ich Ihnen die kostenlosen QuickSite-Workshops von Amazon. Sie bieten weiterführende Tutorials und Schulungen. Vergessen Sie auch nicht, Bright Data zu überprüfen, wenn Sie maßgeschneiderte Datensätze benötigen. Vielen Dank fürs Zuschauen und abonnieren Sie meinen Kanal, um über neue "Build with me"-Videos auf dem Laufenden zu bleiben.