如何將音頻轉錄為文字?免費音頻轉文字工具 | Python 2023
目錄
- 安裝Python和Anaconda
- 建立Python環境
- 下載並安裝Open AI Whisper
- 安裝其他所需文件
- 使用中型模型轉換音頻為文本
- 查看轉錄的文本
安裝Python和Anaconda
首先,我們需要安裝Python和Anaconda。請前往Anaconda的官方網站並下載適用於您的操作系統的版本。安裝完成後,搜索並打開Anaconda命令提示符。
建立Python環境
在Anaconda提示符中,輸入以下命令以創建一個帶有Python的環境:conda create -n Text-to-Speech python=3.9。您可以將“text-to-speech”替換為您喜歡的環境名稱。按Enter鍵執行命令。
下載並安裝Open AI Whisper
接下來,我們需要下載並安裝Open AI Whisper。在Anaconda提示符中,切換到剛剛創建的環境:conda activate text-to-speech。
然後,從GitHub頁面下載Whisper的源碼。解壓縮下載的ZIP文件,並將文件夾保存在您喜歡的位置。
回到Anaconda提示符,使用cd命令將當前目錄切換到Whisper文件夾的位置。
使用以下命令安裝Whisper所需的其他文件:conda install -c conda-forge ffmpeg-python。
使用中型模型轉換音頻為文本
現在,我們可以使用Whisper來將音頻轉換為文本。首先,確保您有一個要轉錄的音頻文件。將音頻文件保存在Whisper文件夾中。
在Anaconda提示符中,確保您仍然在Whisper文件夾的位置。然後,使用以下命令將音頻文件轉換為文本:whisper.transcribe("your_audio_file.wav", "medium", language="en").
請將"your_audio_file.wav"替換為您要轉錄的音頻文件的名稱。請注意,您可以根據需要更改模型的大小(large、medium、small)以及語言。
轉錄完成後,您將在Whisper文件夾中找到轉錄的文本文件。
查看轉錄的文本
最後,您可以打開轉錄的文本文件以查看結果。找到剛剛轉錄的文件,用記事本或任何文本編輯器打開它。
這樣就完成了將音頻轉換為文本的過程。希望本教程對您有所幫助!謝謝!