如何將音頻轉錄為文字?免費音頻轉文字工具 | Python 2023

Find AI Tools
No difficulty
No complicated process
Find ai tools

如何將音頻轉錄為文字?免費音頻轉文字工具 | Python 2023

目錄

  • 安裝Python和Anaconda
  • 建立Python環境
  • 下載並安裝Open AI Whisper
  • 安裝其他所需文件
  • 使用中型模型轉換音頻為文本
  • 查看轉錄的文本

安裝Python和Anaconda

首先,我們需要安裝Python和Anaconda。請前往Anaconda的官方網站並下載適用於您的操作系統的版本。安裝完成後,搜索並打開Anaconda命令提示符。

建立Python環境

在Anaconda提示符中,輸入以下命令以創建一個帶有Python的環境:conda create -n Text-to-Speech python=3.9。您可以將“text-to-speech”替換為您喜歡的環境名稱。按Enter鍵執行命令。

下載並安裝Open AI Whisper

接下來,我們需要下載並安裝Open AI Whisper。在Anaconda提示符中,切換到剛剛創建的環境:conda activate text-to-speech。

然後,從GitHub頁面下載Whisper的源碼。解壓縮下載的ZIP文件,並將文件夾保存在您喜歡的位置。

回到Anaconda提示符,使用cd命令將當前目錄切換到Whisper文件夾的位置。

使用以下命令安裝Whisper所需的其他文件:conda install -c conda-forge ffmpeg-python。

使用中型模型轉換音頻為文本

現在,我們可以使用Whisper來將音頻轉換為文本。首先,確保您有一個要轉錄的音頻文件。將音頻文件保存在Whisper文件夾中。

在Anaconda提示符中,確保您仍然在Whisper文件夾的位置。然後,使用以下命令將音頻文件轉換為文本:whisper.transcribe("your_audio_file.wav", "medium", language="en").

請將"your_audio_file.wav"替換為您要轉錄的音頻文件的名稱。請注意,您可以根據需要更改模型的大小(large、medium、small)以及語言。

轉錄完成後,您將在Whisper文件夾中找到轉錄的文本文件。

查看轉錄的文本

最後,您可以打開轉錄的文本文件以查看結果。找到剛剛轉錄的文件,用記事本或任何文本編輯器打開它。

這樣就完成了將音頻轉換為文本的過程。希望本教程對您有所幫助!謝謝!

Most people like

Are you spending too much time looking for ai tools?
App rating
4.9
AI Tools
100k+
Trusted Users
5000+
WHY YOU SHOULD CHOOSE TOOLIFY

TOOLIFY is the best ai tool source.