Skip to content

Este repositório documenta um projeto de análise de dados e modelagem baseado no dataset Handover.

Notifications You must be signed in to change notification settings

igorfalcao/Projeto_Handover

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 

Repository files navigation

📊 Projeto: Análise e Modelagem de Dados do Dataset Handover 🚀

Este repositório documenta um projeto de análise de dados e modelagem baseado no dataset Handover. O objetivo principal é explorar dados, realizar pré-processamento, treinar modelos e avaliar desempenhos preditivos. 🧠💡


📂 Estrutura do Projeto

Notebooks Principais

  • Dataset_handover.ipynb: Contém todas as etapas do projeto, incluindo:
    • Conexão com o Dataset: Carregamento de dados do CSV para análise.
    • Pré-processamento: Limpeza, seleção de variáveis e normalização.
    • Treinamento de Modelos: Execução de algoritmos de aprendizado de máquina.
    • Avaliação de Resultados: Análise das métricas de desempenho.

Datasets

  • dataset_train.csv: Conjunto de treinamento com:
    • 2700 registros (502 com falhas e 2198 sem falhas).
  • dataset_test.csv: Conjunto de teste utilizado para validação do modelo.

⚙️ Principais Etapas do Projeto

  1. 📥 Conexão com o Dataset

    • Importação de dados diretamente de arquivos CSV.
    • Verificação de integridade e estatísticas descritivas iniciais.
  2. 🧹 Pré-processamento

    • Renomeação e padronização de variáveis.
    • Tratamento de valores ausentes e outliers.
    • Dimensionamento da base de treino e teste.
  3. 📊 Modelagem

    • Implementação de diversos algoritmos:
      • Regressão Linear.
      • Random Forest.
      • Redes Neurais.
    • Treinamento sem validação cruzada, focando na avaliação direta com o conjunto de teste.
  4. 📈 Avaliação de Resultados

    • Métricas calculadas:
      • Acurácia.
      • Precisão.
      • F1-score.
    • Resultados salvos em arquivos Excel para análise posterior.
  5. 📤 Exportação de Resultados

    • Geração de arquivos CSV e relatórios em Excel com previsões e métricas.

🔧 Requisitos do Ambiente

  • Python 3.7 ou superior 🐍
  • Bibliotecas necessárias:
    • pandas para manipulação de dados 🗂️
    • numpy para cálculos matemáticos ⚙️
    • sklearn para modelagem preditiva 🧠
    • matplotlib e seaborn para visualizações 📊

🚀 Como Usar

  1. Clone o repositório:

    git clone https://github.com/seu-usuario/seu-repositorio.git
  2. Instale as dependências:

    pip install -r requirements.txt
  3. Execute o notebook: Abra o arquivo Dataset_handover.ipynb no Jupyter Notebook e siga as etapas descritas.


🌟 Objetivos do Projeto

  • Prever falhas com alta precisão utilizando dados históricos. 🔍
  • Gerar insights acionáveis para melhorar a qualidade dos dados e processos. 📑
  • Desenvolver um pipeline reutilizável para análise e modelagem. ⚙️

💬 Contribuições

Contribuições são bem-vindas! 😊 Sinta-se à vontade para:

  • Relatar problemas abrindo uma issue. 🐛
  • Enviar melhorias por meio de um pull request. 🚀

Juntos, podemos construir soluções inovadoras e eficientes! 💻✨

About

Este repositório documenta um projeto de análise de dados e modelagem baseado no dataset Handover.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published