Classificação de Imagens com Notebooks no Azure ML
Índice
🚀 Introdução
- Reconhecimento de Imagens de Números Manuscritos
- Ferramentas Necessárias
- Visão Geral do Artigo
🛠️ Configuração do Ambiente
- Configurando o Ambiente no Azure Machine Learning Studio
- Importação de Pacotes
- Definição de Funções
🔍 Exploração de Dados
- Download do Conjunto de Dados MNIST
- Divisão do Conjunto de Dados
- Visualização de Amostras
🤖 Treinamento do Modelo
- Construção de um Modelo de Regressão Logística Multiclasse
- Introdução à Biblioteca Scikit-Learn
- Configuração de Parâmetros
- Treinamento do Modelo
- Avaliação da Precisão
📊 Resultados
- Visualização dos Resultados
- Métricas de Desempenho
- Registro do Modelo
🚀 Exportação e Implantação
- Conversão do Notebook para Script Python
- Configuração do Ambiente de Execução Remota
- Submissão do Trabalho para Execução Remota
- Registro do Modelo na Workspace AML
Reconhecimento de Imagens de Números Manuscritos Usando Azure Machine Learning
Olá pessoal, hoje vamos explorar como construir um modelo de reconhecimento de imagens para reconhecer números manuscritos em Python. Vou mostrar como fazer isso usando notebooks no Azure Machine Learning Studio e enquanto construímos o modelo, há algumas características emocionantes dos notebooks que quero mostrar para vocês.
🚀 Introdução
O reconhecimento de imagens de números manuscritos é uma aplicação fascinante da aprendizagem de máquina. Neste artigo, vamos explorar como construir um modelo simples de regressão logística multiclasse usando o conjunto de dados MNIST.
🛠️ Configuração do Ambiente
Antes de começarmos, vamos configurar nosso ambiente no Azure Machine Learning Studio e importar os pacotes necessários para o projeto. Também definiremos algumas funções úteis para facilitar o processo.
Importação de Pacotes
Começaremos importando os pacotes necessários para o nosso projeto, incluindo aqueles para manipulação de dados, visualização e modelagem.
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
🔍 Exploração de Dados
Na etapa de exploração de dados, faremos o download do conjunto de dados MNIST e o dividiremos em conjuntos de treinamento e teste. Em seguida, visualizaremos algumas amostras para entender melhor os dados.
Download do Conjunto de Dados MNIST
O conjunto de dados MNIST consiste em 70.000 imagens em escala de cinza, cada uma representando dígitos manuscritos de 0 a 9.
from sklearn.datasets import fetch_openml
mnist = fetch_openml('mnist_784')
X, y = mnist.data, mnist.target
🤖 Treinamento do Modelo
Vamos treinar nosso modelo de regressão logística multiclasse usando o conjunto de dados MNIST. A regressão logística é uma técnica simples, mas eficaz, para classificação de dados.
Construção de um Modelo de Regressão Logística Multiclasse
Vamos inicializar e treinar nosso modelo de regressão logística.
# Divisão do conjunto de dados em treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# Inicialização do modelo
model = LogisticRegression(max_iter=1000)
# Treinamento do modelo
model.fit(X_train, y_train)
📊 Resultados
Vamos agora avaliar o desempenho do nosso modelo usando métricas apropriadas.
Visualização dos Resultados
Podemos visualizar os resultados do nosso modelo para entender como ele está se saindo.
# Predições
y_pred = model.predict(X_test)
# Avaliação da precisão
accuracy = model.score(X_test, y_test)
print("Accuracy:", accuracy)
🚀 Exportação e Implantação
Agora que nosso modelo está treinado e avaliado, podemos exportá-lo para uso futuro e implantá-lo em produção.
Conversão do Notebook para Script Python
Vamos converter nosso notebook em um script Python para facilitar a execução remota.
# Exportação do notebook para script Python
!jupyter nbconvert --to script notebook.ipynb
FAQ (Perguntas Frequentes)
Como posso acessar o conjunto de dados MNIST?
Você pode acessar o conjunto de dados MNIST diretamente do repositório do OpenML ou através da biblioteca scikit-learn.
Qual é a precisão do modelo de regressão logística?
A precisão do modelo pode variar, mas geralmente é Alta, especialmente após o ajuste de hiperparâmetros e técnicas de pré-processamento adequadas.
Como posso melhorar a precisão do modelo?
Você pode experimentar diferentes algoritmos de classificação, ajustar os hiperparâmetros do modelo, realizar pré-processamento adicional nos dados ou até mesmo aumentar o tamanho do conjunto de dados de treinamento.
Recursos: