Essa é a gravação do curso Introdução à Ciência de Dados que foi ministrado ao vivo pelos Professores Dr. Wagner Hugo Bonat e Walmes Marquez Zeviani dentro do Projeto Ômega Data Science.
Conheça todos os nossos cursos e nos sigam nas redes sociais
Entre para o nosso grupo no telegram
Twitter @omegadatascienc
ESSA É UMA VERSÃO GRATUITA DO CURSO E PODE SER RETIRADA DO AR A QUALQUER MOMENTO
Tenha uma visão geral da área de Ciência de Dados com ênfase em fundamentos
estatísticos e ferramentas computacionais. O Curso foi desenhado para ser acessível
a todos os públicos oferecendo uma visão geral da área de ciência de dados suas
principais técnicas e ferramentas computacionais utilizando a linguagem R
.
Serão apresentadas as principais técnicas de análise exploratória e visualização de dados.
Fundamentos estatísticos da Ciência de Dados, modelos estatísticos básicos como regressão
linear múltipla e regressão logística. Por fim, algumas técnicas populares de
aprendizagem de máquina serão discutidas e exemplificadas.
O Curso é ideal para quem é entusiasta da área ou está buscando uma reorientação
profissional considerando a área de dados.
Carga horária: 18 horas + atividades Nível: Iniciante Pré-requisitos: Não há. Público-alvo: Profissionais de todas as áreas.
- Entenda o que é Ciência de Dados e como você pode ingressar nesta área.
- Aprenda os princípios da análise de dados e destaque-se no mercado de trabalho.
- Seja reconhecido pelo seu senso analítico compreendendo modelos estatísticos e de aprendizado de máquina.
Neste módulo você vai aprender o que é Ciência de Dados e porque todas as empresas estão procurando por pessoas capazes de analisar e tirar informações relevantes de grandes massas de dados. Você vai compreender como atua, onde trabalha, quanto ganha e qual a demanda por profissionais de dados no mercado de trabalho atual e quais são as expectativas para o futuro. Você vai entender quais são as opções para estudar Ciência de Dados e quais são os requisitos básicos para iniciar na área. Além disso, você verá que existem outras profissões, como engenheiro de dados, analista de dados, engenheiro de machine learning entre outras e como elas estão relacionadas com a Ciência de Dados. Por fim, você vai aprender as principais técnicas para estruturar e resolver um problema de negócio com dados.
Vídeo-aula 1 · Parte I Vídeo-aula 1 · Parte II Slides
Neste módulo você vai aprender como começar a explorar um conjunto de dados por meio de técnicas numéricas. Vai entender e vivenciar a importância da análise exploratória de dados, suas principais técnicas e como usá-las em R. Você vai conhecer os diferentes tipos de dados e como resumi-los de forma efetiva. Será exposto a diferentes tipos de problemas com a qualidade dos dados e estratégias para superá-los. Na sequência você terá uma visão completa das tarefas de limpeza, preparação, transformação e agregação de dados. Terá a oportunidade de praticar o que aprendeu em um projeto com dados reais.
Comunicar os resultados de uma análise exploratória é fundamental para o sucesso de
qualquer análise de dados. Uma das formas mais efetivas de fazer isso é por meio de
técnicas gráficas. Neste módulo, você vai dominar diversas técnicas e princípios da
visualização de dados como uma ferramenta para subsidiar a tomada de decisões.
Você vai aprender qual é o melhor tipo de gráfico para cada tipo de variável.
Todas as análises serão acompanhadas de prática com dados reais e código R
.
Vídeo-aula 3 · Parte I Vídeo-aula 3 · Parte II Slides Script R
Tomar decisões na presença de incerteza é o núcleo da atividade de um cientista de dados. A Estatística é a principal ferramenta neste processo. Neste módulo, você entenderá o “O pensamento estatístico”, ou seja, como a estatística é empregada para tomar decisões. Quais são os principais ingredientes da metodologia estatística. Você vai aprender como estruturar e pensar em um problema de dados como um estatístico, aguçando o seu pensamento analitico e sistêmico.
Entender uma realidade complexa de negócio é uma tarefa comum para um cientista de dados. Para isso, você deve aprender a simplificar a realidade por meio de modelos estatísticos. Neste módulo, você vai entender quais são os principais ingredientes de um modelo estatístico e suas principais aplicações. Vai interpretar os resultados de um modelo e usá-lo para fazer predições e tomar decisões em diferentes contextos de negócios e produtos baseados em dados.
Tomar decisões na presença de incerteza de forma rápida, automatizada e assertiva é um
grande diferencial competitivo em qualquer ramo de negócio. As técnicas de aprendizagem
de máquina vêm sendo usadas com sucesso dentro deste contexto e fazem parte do arsenal
metodológico de um cientista de dados. Neste módulo, você vai aprender os diferentes tipos
de aprendizagem de máquina, as etapas para treinamento e validação de um modelo, bem como,
sua implementação computacional usando o software R
e casos reais.