Echtzeit-Spracherkennung in 15 Minuten mit AssemblyAI
Inhaltsverzeichnis:
- Einführung
- Transkription von Audio in Echtzeit
- Herausforderungen bei der Echtzeit-Transkription
- Vorteile der Echtzeit-Transkription
- Assembly AI: Der Real-Time Transkriber
- Einrichtung und Konfiguration von Assembly AI
- Installation der benötigten Abhängigkeiten
- Erstellung eines Projektordners und Konfigurationsdateien
- Mikrofon-Streaming einrichten
- Verbindung zu Assembly AI herstellen
- Asynchrone Funktionen für das Senden und Empfangen der Daten
- Anzeige der Transkription in der Konsole
- Erstellung einer Streamlit-Anwendung
- Weitere Verbesserungen und Funktionalitäten
- Fazit
Artikel: Echtzeit-Transkription von Audio mit Assembly AI
🎙️ Die Transkription von Audio in Echtzeit kann eine echte Herausforderung sein. Besonders wenn das gesprochene Wort schnell ist, Füllwörter verwendet werden oder im Hintergrund Lärm vorhanden ist. Assembly AI bietet jedoch eine Lösung: Den Real-Time Transkriber. In diesem Artikel zeige ich Ihnen, wie Sie den Real-Time Transkriber von Assembly AI verwenden können und wie Sie ihn in einer Streamlit-Anwendung integrieren können.
Die Einrichtung des Assembly AI-Transkribers ist denkbar einfach. Alles was Sie benötigen, ist ein Assembly AI-Konto und einen API-Token. Nach der Erstellung Ihres Kontos können Sie den API-Token in Ihrem Profil einsehen. Um den Real-Time Transkriber zu nutzen, müssen Sie möglicherweise Ihr Konto auf einen kostenpflichtigen Plan upgraden. Sobald Sie Ihren API-Token haben und Ihr Konto entsprechend konfiguriert ist, können wir mit der Installation der erforderlichen Abhängigkeiten beginnen.
Die beiden wichtigsten Abhängigkeiten für unser Projekt sind "Pi audio", um den Audio-Stream vom Mikrofon zu erhalten, und "websockets", um die Kommunikation mit der Assembly AI-API herzustellen. Die Installation dieser Abhängigkeiten ist mit pip sehr einfach. Sobald die Abhängigkeiten installiert sind, können wir unseren Projektordner erstellen und unsere Konfigurationsdateien einrichten.
Um den Mikrofon-Stream einzurichten, verwenden wir "pi audio", um die Eingabe vom Mikrofon im Stream zu erhalten. Dafür müssen einige Konstanten für die Puffergröße, die Abtastrate und die Kanäle festgelegt werden. Anschließend müssen wir eine Verbindung zur Assembly AI-API herstellen. Hierfür verwenden wir "websockets" und den von Assembly AI bereitgestellten Endpunkt. Nachdem die Verbindung hergestellt wurde, können wir unsere asynchronen Funktionen zum Senden und Empfangen der Daten einrichten.
Die Hauptfunktion unserer asynchronen Funktionen besteht darin, den Eingabe-Stream vom Mikrofon kontinuierlich zu senden und gleichzeitig auf die Transkriptionen von Assembly AI zu hören. Dabei nutzen wir die "Send" und "Receive" Funktionen, um Daten vom Mikrofon an die Assembly AI-API zu senden und die Transkriptionen von Assembly AI zu empfangen. Die empfangenen Daten werden dann in der Konsole ausgegeben. Um dies kontinuierlich durchzuführen, rufen wir diese Funktionen in einer Schleife auf.
Nachdem wir den Grundmechanismus des Real-Time Transkribers verstanden haben, können wir unsere Anwendung zu einer Streamlit-Anwendung erweitern. Mit Streamlit können wir die Transkriptionen in Echtzeit auf dem Bildschirm anzeigen. Dafür fügen wir zwei Buttons hinzu, einen zum Starten und einen zum Stoppen des Transkriptionsprozesses. Durch das Hinzufügen von Session States können wir den Start- und Stoppvorgang steuern und so die kontinuierliche Überwachung des Mikrofons kontrollieren.
Insgesamt bietet Assembly AI mit ihrem Real-Time Transkriber eine leistungsstarke Lösung für die Echtzeit-Transkription von Audio. Die Einrichtung ist einfach und die Integration in Streamlit ermöglicht es uns, die Transkriptionen in Echtzeit sichtbar zu machen. Mit diesem Werkzeug können wir jetzt Audio in Echtzeit transkribieren und von den Vorteilen einer automatisierten Transkriptionslösung profitieren.
Pros:
- Einfache Einrichtung und Konfiguration
- Kontinuierliches Streaming und Echtzeit-Transkription
- Integration in Streamlit für eine benutzerfreundliche Anzeige der Transkriptionen
Cons:
- Benötigt eine kostenpflichtige Mitgliedschaft für die Echtzeit-Transkription
Insgesamt ist die Verwendung des Real-Time Transkribers von Assembly AI eine großartige Möglichkeit, schnell und effizient Audio in Echtzeit zu transkribieren. Das Tool bietet eine einfache Einrichtung, eine benutzerfreundliche Integration und eine zuverlässige Transkriptionsleistung.
Hervorhebungen
- Einfache Einrichtung und Konfiguration des Assembly AI Real-Time Transkribers.
- Integration des Transkribers in eine Streamlit-Anwendung für eine benutzerfreundliche Anzeige der Transkriptionen.
- Kontinuierliches Streaming und Echtzeit-Transkription von Audio.
FAQ
Frage: Kann ich den Assembly AI Real-Time Transkriber kostenlos nutzen?
Antwort: Die grundlegende Nutzung von Assembly AI ist kostenlos. Für die Echtzeit-Transkription ist jedoch eine kostenpflichtige Mitgliedschaft erforderlich.
Frage: Kann ich den Real-Time Transkriber in meiner eigenen Anwendung verwenden?
Antwort: Ja, Assembly AI bietet eine API, die es Ihnen ermöglicht, den Real-Time Transkriber in Ihre eigenen Anwendungen zu integrieren.
Frage: Gibt es Beschränkungen für die Transkriptionslänge beim Einsatz des Real-Time Transkribers?
Antwort: Ja, Assembly AI begrenzt die Transkriptionslänge auf maximal 5 Stunden pro Monat für kostenlose Konten und auf 100 Stunden pro Monat für kostenpflichtige Konten.
Frage: Kann ich die Spracheinstellungen für den Real-Time Transkriber anpassen?
Antwort: Ja, Assembly AI unterstützt verschiedene Sprachen, darunter auch Deutsch. Sie können die Spracheinstellungen entsprechend anpassen.
Frage: Ist die Transkription in Echtzeit präzise und zuverlässig?
Antwort: Der Real-Time Transkriber von Assembly AI bietet eine hohe Genauigkeit und Zuverlässigkeit bei der Transkription von Audio in Echtzeit. Die Transkriptionsqualität hängt jedoch von der Aufnahmequalität und der Sprachverständlichkeit ab.
Ressourcen
Bitte beachten Sie, dass die Verwendung des Assembly AI Real-Time Transkribers abhängig von den jeweiligen Nutzungsbedingungen, Preisen und Einschränkungen der Assembly AI-Plattform ist. Stellen Sie daher sicher, dass Sie sich über die aktuellen Informationen informieren, bevor Sie den Transkriber nutzen.