ChatTTSは、会話シナリオ向けに特別に設計された声の生成モデルで、GitHubの2noise/chatttsにあります。特に大規模言語モデルアシスタントの対話タスクや会話用の音声およびビデオイントロなどのアプリケーションに最適です。このモデルは中国語と英語の両方をサポートし、音声合成において高品質かつ自然さを示しています。ChatTTSは約100,000時間の中国語と英語のデータで訓練されています。
ChatTTSを使用するには、GitHubからコードをダウンロードし、必要なパッケージをインストールし、必要なライブラリをインポートし、ChatTTSを初期化し、テキストを準備し、音声を生成し、オーディオを再生します。詳細な手順と例はドキュメントに記載されています。