Este repositório documenta um projeto de análise de dados e modelagem baseado no dataset Handover. O objetivo principal é explorar dados, realizar pré-processamento, treinar modelos e avaliar desempenhos preditivos. 🧠💡
Dataset_handover.ipynb
: Contém todas as etapas do projeto, incluindo:- Conexão com o Dataset: Carregamento de dados do CSV para análise.
- Pré-processamento: Limpeza, seleção de variáveis e normalização.
- Treinamento de Modelos: Execução de algoritmos de aprendizado de máquina.
- Avaliação de Resultados: Análise das métricas de desempenho.
dataset_train.csv
: Conjunto de treinamento com:- 2700 registros (502 com falhas e 2198 sem falhas).
dataset_test.csv
: Conjunto de teste utilizado para validação do modelo.
-
📥 Conexão com o Dataset
- Importação de dados diretamente de arquivos CSV.
- Verificação de integridade e estatísticas descritivas iniciais.
-
🧹 Pré-processamento
- Renomeação e padronização de variáveis.
- Tratamento de valores ausentes e outliers.
- Dimensionamento da base de treino e teste.
-
📊 Modelagem
- Implementação de diversos algoritmos:
- Regressão Linear.
- Random Forest.
- Redes Neurais.
- Treinamento sem validação cruzada, focando na avaliação direta com o conjunto de teste.
- Implementação de diversos algoritmos:
-
📈 Avaliação de Resultados
- Métricas calculadas:
- Acurácia.
- Precisão.
- F1-score.
- Resultados salvos em arquivos Excel para análise posterior.
- Métricas calculadas:
-
📤 Exportação de Resultados
- Geração de arquivos CSV e relatórios em Excel com previsões e métricas.
- Python 3.7 ou superior 🐍
- Bibliotecas necessárias:
pandas
para manipulação de dados 🗂️numpy
para cálculos matemáticos ⚙️sklearn
para modelagem preditiva 🧠matplotlib
eseaborn
para visualizações 📊
-
Clone o repositório:
git clone https://github.com/seu-usuario/seu-repositorio.git
-
Instale as dependências:
pip install -r requirements.txt
-
Execute o notebook: Abra o arquivo
Dataset_handover.ipynb
no Jupyter Notebook e siga as etapas descritas.
- Prever falhas com alta precisão utilizando dados históricos. 🔍
- Gerar insights acionáveis para melhorar a qualidade dos dados e processos. 📑
- Desenvolver um pipeline reutilizável para análise e modelagem. ⚙️
Contribuições são bem-vindas! 😊 Sinta-se à vontade para:
- Relatar problemas abrindo uma issue. 🐛
- Enviar melhorias por meio de um pull request. 🚀
Juntos, podemos construir soluções inovadoras e eficientes! 💻✨