訪問AI，驚喜連連！

Find AI Tools

No difficulty

No complicated process

Find ai tools

Home AI News TW 訪問AI，驚喜連連！

訪問AI，驚喜連連！

介绍
使用的Python库和API
步骤1: 安装所需的Python库
步骤2: 创建配置文件
步骤3: 设置Streamlit应用程序界面
步骤4: 连接到Assembly AI API
步骤5: 连接到OpenAI GPT-3 API
步骤6: 发送语音到Assembly AI进行实时转录
步骤7: 处理Assembly AI的实时文本响应
步骤8: 将文本传递给GPT-3进行自然语言回复
步骤9: 显示GPT-3的响应文本到Streamlit应用程序界面
总结

🎯目标：使用Python和API创建一个人类-人工智能对话应用程序

介绍

您好！在本教程中，我们将使用Python和几个API创建一个允许您与人工智能进行对话的应用程序。我们将使用Assembly AI API进行实时语音转录，并使用OpenAI GPT-3 API生成人工智能回应。这是一个有趣且实用的项目，您可以将它应用于语音助手、聊天机器人等领域。

使用的Python库和API

在本教程中，我们将使用以下Python库和API：

Streamlit：用于创建Web应用程序界面的库。
Pyaudio：用于处理音频输入的库。
Websockets：用于与API进行WebSocket通信的库。
Base64：用于编码音频数据的库。
Json：用于处理JSON数据的库。
Assembly AI API：用于实时语音转录的API。
OpenAI GPT-3 API：用于生成人工智能回应的API。

接下来，我们将逐步讲解如何使用这些库和API来构建我们的人类-人工智能对话应用程序。

步骤1: 安装所需的Python库

在开始之前，我们需要安装所需的Python库。请确保已安装pip，并在终端窗口中运行以下命令来安装所需的库：

pip install streamlit pyaudio websockets

步骤2: 创建配置文件

首先，我们需要创建一个配置文件，以保存我们的API密钥。请按照以下步骤进行操作：

创建一个名为config.py的Python文件。
在config.py中定义两个变量，分别存储您的Assembly AI和OpenAI GPT-3的API密钥。
例如，您的config.py文件应如下所示：

assembly_api_key = "YOUR_ASSEMBLY_API_KEY_HERE"
gpt3_api_key = "YOUR_GPT3_API_KEY_HERE"

请将"YOUR_ASSEMBLY_API_KEY_HERE"和"YOUR_GPT3_API_KEY_HERE"替换为您自己的API密钥。

步骤3: 设置Streamlit应用程序界面

接下来，我们将使用Streamlit库来创建我们的应用程序界面。请按照以下步骤进行操作：

在项目文件夹中创建一个名为main.py的Python文件。
导入所需的Python库：

import streamlit as st
import pyaudio
import websockets
import base64
import json
import config

使用Streamlit的title函数来设置应用程序的标题：

st.title("人类-人工智能对话应用程序")

使用Streamlit的columns函数创建两个列，用于放置录制和停止录制按钮：

start_button, stop_button = st.columns(2)

使用Streamlit的button函数分别创建录制和停止录制按钮：

start_recording = start_button.button("开始录制")
stop_recording = stop_button.button("停止录制")

创建一个Streamlit的text组件，用于显示来自语音助手的回应：

response_text = st.text("")

将以下代码放在一个名为if start_recording:的条件语句中，以响应录制按钮的点击事件：

if start_recording:
    # 在此处添加录制音频的代码

将以下代码放在一个名为if stop_recording:的条件语句中，以响应停止录制按钮的点击事件：

if stop_recording:
    # 在此处添加停止录制音频的代码

在项目文件夹中打开终端窗口，并运行以下命令来启动Streamlit应用程序：

streamlit run main.py

打开浏览器，并访问http://localhost:8501以查看Streamlit应用程序界面。

到目前为止，我们已经设置了Streamlit应用程序界面，但它还没有与任何API进行通信。在接下来的步骤中，我们将向应用程序添加与Assembly AI和OpenAI GPT-3 API的集成。

步骤4: 连接到Assembly AI API

现在，我们将使用Assembly AI API来进行实时语音转录。请按照以下步骤进行操作：

使用websockets.connect函数连接到Assembly AI的WebSocket端点：

async with websockets.connect("wss://api.AssemblyAI.com/v2/real-time/ws") as websocket:
    # 在此处添加与Assembly AI的通信代码

在Python的while循环中，读取音频数据并将其发送到Assembly AI API进行实时转录：

while start_recording:
    # 在此处添加读取音频数据并发送到Assembly AI的代码

在循环的每次迭代中，读取音频数据并使用base64.b64encode函数对其进行编码：

data = stream.Read(frames_per_buffer)
encoded_data = base64.b64encode(data).decode("utf-8")

将编码后的音频数据封装在一个JSON对象中，并将其作为字符串发送到Assembly AI的WebSocket端点：

message = json.dumps({
    "audio": encoded_data
})
await websocket.send(message)

收到Assembly AI的实时转录响应后，在循环外部使用st.text函数显示转录的文本：

response = await websocket.recv()
transcript = json.loads(response)["text"]
response_text.text(transcript)

完成上述步骤后，我们的应用程序将能够将语音数据发送到Assembly AI进行实时转录，并将转录的文本显示在应用程序界面上。

步骤5: 连接到OpenAI GPT-3 API

现在，我们将使用OpenAI GPT-3 API来生成人工智能回应。请按照以下步骤进行操作：

使用OpenAI的openai.Completion.Create函数连接到GPT-3 API：

response = openai.Completion.create(
    engine="davinci",
    prompt=transcript,
    max_tokens=50
)

使用API返回的JSON响应获取GPT-3生成的回应文本：

gpt_response = response.choices[0].text

使用st.write函数将GPT-3的回应文本显示在应用程序界面上：

st.write(gpt_response)

完成上述步骤后，我们的应用程序将能够将转录的文本发送到GPT-3进行处理，并将生成的回应文本显示在应用程序界面上。

步骤6: 发送语音到Assembly AI进行实时转录

现在，我们将集成所有部分，以便我们的应用程序能够实时将语音数据发送到Assembly AI进行转录，并将Assembly AI的转录结果发送到GPT-3进行回答。请按照以下步骤进行操作：

将之前编写的连接到Assembly AI和GPT-3的代码放入if start_recording:和if stop_recording:条件语句中：

if start_recording:
    async with websockets.connect("wss://api.assemblyai.com/v2/real-time/ws") as websocket:
        while start_recording:
            # 读取音频数据并发送到Assembly AI
elif stop_recording:
    response = openai.Completion.create(
        engine="davinci",
        prompt=transcript,
        max_tokens=50
    )
    gpt_response = response.choices[0].text
    st.write(gpt_response)

在每次迭代中，使用Assembly AI的await websocket.recv()来接收实时转录的文本，并将其存储在transcript变量中：

response = await websocket.recv()
transcript = json.loads(response)["text"]
response_text.text(transcript)

将转录的文本作为GPT-3的输入，并将生成的回应文本显示在应用程序界面上。

完成上述步骤后，我们的应用程序将能够实时将语音数据发送到Assembly AI进行转录，并将转录结果发送到GPT-3进行回答，并将回应文本显示在应用程序界面上。

总结

在本教程中，我们使用Python和几个API创建了一个人类-人工智能对话应用程序。我们使用Assembly AI API进行实时语音转录，并使用OpenAI GPT-3 API生成人工智能回应。我们通过Streamlit创建了一个简单的应用程序界面，并连接了各个部分以实现完整的功能。现在，您可以享受与人工智能的交互，通过语音向它提问并获得智能回答。希望本教程能够为您提供帮助，感谢您的阅读！

请注意：本教程中使用的API密钥是示例密钥，请使用您自己的密钥来访问相应的API。

AI變得有感情？夢幻的人工智慧世界

超讚又難忘 - 第9.8集：有感知的聊天機器人酥皮洞察力