Gerador Automático de Legendas para Vídeos usando Python | Tutorial Instagram Reels & YouTube Shorts

Find AI Tools

No difficulty

No complicated process

Find ai tools

Home AI News PT Gerador Automático de Legendas para Vídeos usando Python | Tutorial Instagram Reels & YouTube Shorts

Gerador Automático de Legendas para Vídeos usando Python | Tutorial Instagram Reels & YouTube Shorts

Tabela de Conteúdos:

Introdução
Como são criadas as legendas automáticas?
Automatizando o processo com um script em Python
Transcrição de áudio com o AI Whisper
Preparando o vídeo para o Instagram Reels e YouTube Shorts
Segmentando a transcrição e inserindo nas frames
Produzindo o vídeo de saída
Configurando o ambiente de trabalho
Extrair o áudio do vídeo
Extrair as frames do vídeo
Criar o vídeo de saída
Conclusão

Como são criadas as legendas automáticas?

Você já se perguntou como as legendas automáticas são criadas? Neste vídeo, vou te mostrar um simples script em Python que utiliza inteligência artificial (AI) para automatizar esse processo e produzir o seu próximo Instagram Reel a partir de um vídeo. Vamos começar!

Introdução

Para criar as legendas automáticas, primeiro precisamos extrair o áudio do vídeo. Em seguida, utilizamos a inteligência artificial AI Whisper para obter a transcrição completa do áudio. A partir daí, vamos extrair todas as frames do vídeo e ajustá-las para uma proporção horizontal de 16 por 9, ideal para o Instagram Reels e o YouTube Shorts. Em seguida, vamos segmentar a transcrição obtida pelo Whisper e inserir o texto nas frames correspondentes. Por fim, reunimos todas as frames e produzimos o vídeo de saída. Vamos agora iniciar o processo passo a passo.

Automação do Processo com um Script em Python

O primeiro passo é abrir um arquivo Python e importar as bibliotecas necessárias. Se você não tiver uma biblioteca específica instalada, basta digitar pip install nome_da_biblioteca no terminal para instalá-la. Lembre-se de que é possível instalar várias bibliotecas em uma única linha, separando-as por espaços.

Em seguida, vamos criar uma classe chamada "VideoTranscriber" com os construtores necessários. Nesse caso, precisamos carregar o modelo do Whisper AI.

Transcrição de Áudio com o AI Whisper

Agora vamos escrever o método "transcribe_video" que realizará a transcrição do áudio. Ao executar esse método, usamos a linha de código especificada para transcrever o áudio e armazenar o texto no resultado da variável. Por enquanto, a variável "audio_path" está vazia, pois ainda não extraímos o áudio do vídeo. O resultado da variável contém um dicionário com informações reais sobre a transcrição. Vamos analisar a chave "segments" para ver o que ela contém.

Preparando o Vídeo para o Instagram Reels e YouTube Shorts

Para ajustar o vídeo ao formato do Instagram Reels e YouTube Shorts, precisamos conhecer informações importantes sobre ele, como largura, altura, proporção de aspecto (16 por 9) e FPS (frames por segundo). Usando alguns cálculos complexos, encontramos o comprimento em pixels para cada caractere na tela.

Agora, para cada segmento de texto da transcrição, encontramos o número de palavras que caberão na tela em um determinado momento, com base no tempo de início e fim do segmento. Em seguida, calculamos o número total de frames que cada segmento deve ser exibido usando o tempo de início e fim com a taxa de FPS.

Segmentando a Transcrição e Inserindo nas Frames

Com todas as informações prévias calculadas, criamos um array de palavras a partir dos segmentos de texto e iteramos sobre elas. Calculamos o comprimento em pixels para cada palavra e subtraímos a largura da tela para descobrir quantas palavras caberão em determinado momento. O texto das legendas será mantido em uma única linha para este vídeo, gerando uma nova matriz com as palavras, o número do quadro inicial e o número do quadro final.

Produzindo o Vídeo de Saída

Agora, vamos extrair o áudio do vídeo usando a biblioteca "moviepy". Carregamos o vídeo utilizando a função "VideoFileClip" e extraímos o áudio utilizando o método "audio". Em seguida, escrevemos o arquivo de áudio em um determinado caminho de saída.

O próximo método é "extract_frames", onde percorremos as frames do vídeo utilizando a biblioteca "opencv" e adicionamos o texto às frames usando as áreas que criamos anteriormente. Basicamente, estamos contando os números das frames e, se o número da frame estiver dentro do intervalo de início e fim, o texto associado será exibido nessas frames. Também interrompemos o loop se o texto atender à condição, para evitar uma complexidade de tempo quadrático.

Finalmente, escreveremos o método que cria o vídeo utilizando as frames extraídas. Esse método cria uma pasta chamada "frames" no diretório principal, caso ela ainda não exista, e chama o método "extract_frames" mencionado acima. Após a extração das frames, usamos a função "ImageSequenceClip" da biblioteca "moviepy" para criar o vídeo. A função recebe uma lista de caminhos de imagens como entrada e também define o áudio no vídeo. O método "write_videofile" exporta o vídeo de saída.

Para testar nosso script, vamos primeiro ver o vídeo de exemplo que utilizaremos. Em seguida, especificamos que usaremos o modelo base do Whisper AI e fornecemos o vídeo de entrada, o nome de saída e a localização do arquivo. Após a execução do script, teremos o resultado final.

Conclusão:

Embora esse seja apenas um exemplo geral de como criar legendas automáticas, há muitas melhorias que podem ser feitas no script. Como de costume, o código estará disponível no GitHub e você poderá encontrar o link na descrição abaixo. Se você gostou do vídeo, considere curtir e se inscrever no canal, além de seguir nas redes sociais para que possamos conversar diretamente sobre futuros vídeos e seleção de conteúdo. Até a próxima!

高兴的笑脸😊

Recursos adicionais:

GitHub: [linkdoGitHub]
Website do Whisper AI: [linkdoWhisperAI]
Instagram: [linkdoInstagram]
YouTube: [linkdoYouTube]

Perguntas frequentes (FAQ)

Q: É possível utilizar o script em Python para criar legendas automáticas em outros idiomas? A: Sim, é possível utilizar o script em Python para criar legendas automáticas em qualquer idioma, pois a transcrição é feita através do AI Whisper, que é capaz de reconhecer e transcrever diferentes idiomas.

Q: O script em Python requer conhecimento avançado de programação? A: Sim, o script em Python requer um conhecimento básico/intermediário de programação em Python. É recomendado ter familiaridade com as bibliotecas utilizadas no script, como "opencv" e "moviepy".

Q: Quais são as vantagens de utilizar legendas automáticas em vídeos? A: Algumas vantagens de utilizar legendas automáticas em vídeos são: tornar o conteúdo acessível para pessoas com deficiência auditiva, possibilitar a compreensão do vídeo em ambientes com o som desligado ou baixo, melhorar o SEO dos vídeos através do reconhecimento de palavras-chave nas legendas, entre outros benefícios.

Q: É possível ajustar as configurações de tamanho e cor das legendas automáticas? A: Sim, é possível ajustar as configurações de tamanho, cor, fonte e posição das legendas automáticas no script em Python. Basta modificar as configurações de exibição de texto nas áreas correspondentes do código.

Gerador Automático de Legendas para Vídeos usando Python | Tutorial Instagram Reels & YouTube Shorts

Gerador Automático de Legendas para Vídeos usando Python | Tutorial Instagram Reels & YouTube Shorts

Tabela de Conteúdos:

Como são criadas as legendas automáticas?

Introdução

Automação do Processo com um Script em Python

Transcrição de Áudio com o AI Whisper

Preparando o Vídeo para o Instagram Reels e YouTube Shorts

Segmentando a Transcrição e Inserindo nas Frames

Produzindo o Vídeo de Saída

Perguntas frequentes (FAQ)

Most people like