ChatTTS est un modèle de génération vocale sur GitHub à 2noise/chattts, spécifiquement conçu pour les scénarios conversationnels. Il est idéal pour des applications telles que des tâches de dialogue pour de grands assistants de modèles linguistiques, ainsi que des introductions audio et vidéo conversationnelles. Le modèle prend en charge le chinois et l'anglais, démontrant une haute qualité et une naturalité dans la synthèse de la parole. ChatTTS est formé sur environ 100 000 heures de données chinoises et anglaises.
Pour utiliser ChatTTS, téléchargez le code depuis GitHub, installez les packages nécessaires, importez les bibliothèques requises, initialisez ChatTTS, préparez le texte, générez la parole et jouez l'audio. Des étapes détaillées et des exemples sont fournis dans la documentation.