Descubra o poder do Pandas AI para consultas de dados!
Índice
- Introdução
- A Biblioteca Pandas AI
- Visão geral
- Instalação
- Utilizando a biblioteca
- Importando a biblioteca
- Lendo e explorando os dados
- Realizando consultas
- Gerando gráficos
- Exemplos de consultas
- Correlação entre classe e taxa de sobrevivência
- Idade dos passageiros
- Taxa de sobrevivência por sexo
- Conclusão
- Recursos
Introdução
Neste artigo, vamos explorar a biblioteca Pandas AI, que é uma nova extensão do pandas em Python. Essa biblioteca utiliza modelos de linguagem de inteligência artificial, como o chat GPT da OpenAI, para permitir que os data frames sejam consultados e respondam a perguntas com base nos dados. Vamos analisar como instalar a biblioteca e usá-la para fazer consultas e gerar gráficos.
Biblioteca Pandas AI
Visão geral
A biblioteca Pandas AI é uma extensão do pandas que permite que os data frames sejam consultados de forma conversacional. Isso significa que é possível fazer perguntas aos data frames e obter respostas com base nos dados. Essa biblioteca utiliza o modelo de linguagem chat GPT da OpenAI para interpretar as consultas e gerar as respostas.
Instalação
Para começar a usar a biblioteca Pandas AI, é necessário instalá-la usando o pip. Basta executar o seguinte comando no terminal:
pip install pandas-ai
Utilizando a biblioteca
Importando a biblioteca
Antes de começar a usar a biblioteca Pandas AI, é necessário importá-la no seu código Python. Você pode fazer isso usando a seguinte linha de código:
import pandas_ai as pdai
Lendo e explorando os dados
Para usar a biblioteca Pandas AI, é necessário ter um data frame do pandas com os dados que você deseja consultar. Você pode ler os dados de um arquivo CSV ou criar um data frame manualmente. Por exemplo, vamos supor que você tenha um arquivo chamado "titanic.csv" com dados sobre passageiros do Titanic. Você pode ler esse arquivo da seguinte forma:
df = pd.read_csv("titanic.csv")
print(df.head())
Isso irá carregar os dados do arquivo CSV em um data frame e exibir as primeiras linhas dos dados.
Realizando consultas
Uma vez que você tenha um data frame carregado, você pode fazer consultas utilizando a biblioteca Pandas AI. Para isso, você precisa criar um objeto Pandas AI e passar o data frame para o objeto. Em seguida, você pode chamar o método run()
do objeto Pandas AI e passar uma pergunta como argumento.
Por exemplo, vamos supor que você queira saber qual é a correlação entre a classe dos passageiros e a taxa de sobrevivência. Você pode fazer a seguinte consulta:
result = pdai.run(df, Prompt="Qual é a correlação entre classe e taxa de sobrevivência?")
print(result)
Isso irá retornar a resposta à sua pergunta com base nos dados do data frame. Você também pode fazer consultas mais complexas, como calcular a média ou a SOMA de uma coluna específica.
Gerando gráficos
Além de fazer consultas simples, a biblioteca Pandas AI também permite gerar gráficos a partir dos dados do data frame. Para isso, basta passar um prompt específico para o método run()
que indique o tipo de gráfico que você deseja gerar.
Por exemplo, vamos supor que você queira gerar um histograma dos preços pagos pelos passageiros para embarcar no Titanic. Você pode fazer a seguinte consulta:
result = pdai.run(df, prompt="Gerar histograma dos preços pagos")
print(result)
Isso irá gerar um histograma dos preços pagos com base nos dados do data frame.
Exemplos de consultas
Correlação entre classe e taxa de sobrevivência
Uma das perguntas que podemos fazer ao data frame é se existe uma correlação entre a classe dos passageiros e a taxa de sobrevivência. Podemos fazer a seguinte consulta:
result = pdai.run(df, prompt="Existe uma correlação entre a classe e a taxa de sobrevivência?")
print(result)
A resposta pode indicar se há uma correlação entre a classe e a taxa de sobrevivência com base nos dados do data frame.
Idade dos passageiros
Outra pergunta que podemos fazer é sobre a idade dos passageiros. Podemos consultar qual é a idade mais nova e a mais velha do data frame da seguinte forma:
result = pdai.run(df, prompt="Qual é a idade mais nova e a mais velha?")
print(result)
A resposta irá fornecer as informações sobre as idades dos passageiros.
Taxa de sobrevivência por sexo
Também podemos fazer consultas sobre a taxa de sobrevivência por sexo dos passageiros. Podemos fazer a seguinte pergunta:
result = pdai.run(df, prompt="Qual é a taxa de sobrevivência por sexo?")
print(result)
A resposta irá fornecer informações sobre a taxa de sobrevivência para cada sexo.
Conclusão
A biblioteca Pandas AI é uma ferramenta poderosa para consultas e análise de dados em data frames. Com sua integração com o modelo de linguagem chat GPT da OpenAI, a biblioteca oferece uma maneira simples e intuitiva de fazer perguntas aos dados e obter respostas relevantes. Além disso, a biblioteca também permite gerar gráficos a partir dos dados, facilitando a visualização e a interpretação dos resultados.
Recursos
- Documentação da biblioteca Pandas AI: link
- Documentação do pandas: link
- Documentação do chat GPT da OpenAI: link