Formação Avançada

Machine Learning and Data Analytics

De análise descritiva a análise preditiva

Objetivos

No final do curso os formandos estarão aptos a utilizar técnicas importação, análise exploratória e transformação de dados, assim como a treinar e desenvolver modelos de análise preditiva de apoio à tomada de decisões de gestão.

Utilizaremos a linguagem R e o editor R Studio para a resolução de casos práticos.

Esta é uma ação de formação vocacionada para diversos tipos de profissionais que procuram evoluir da análise descritiva para a análise preditiva com recurso a algortimos de aprendizagem automática e técnicas de extração de conhecimento de dados.

Será emitido um certificado de formação profissional na plataforma SIGO, de acordo com a Portaria n.º 474/2010, de 8 de julho.

Destinatários

Analistas, cientistas de dados, engenheiros, controllers, consultores ou profissionais em início de carreira que procurem especializar-se nestas áreas.

Programa

Dia 1

Introdução

  • Enquadrar a inteligência artificial (IA) nas empresas e nos negócios
  • Abstração, generalização e extração de conhecimento dos dados
  • Modelo CRISP-DM
  • Recursos úteis disponíveis online

Introdução à linguagem R

  • Instalação de R e R Studio
  • Tipos de dados
  • Importação de dados de ficheiros, de bases de dados e de outras fontes online
  • Vectors, factors, lists e data frames
  • Tidyverse, lubridate, caret e ggplot2

Análise exploratória de dados

  • Medidas de tendência central e medidas de dispersão
  • Visual data mining: compreender a gramática dos gráficos
  • Boxplots, histogramas, scatterplots e matrizes de correlação

Pré processamento de dados

  • Integração, balanceamento, transformação e limpeza de dados
  • Técnicas de amostragem
  • Como lidar com a "maldição da dimensionalidade" com Principal Component Analysis e análise fatorial
Dia 2

Modelos preditivos

  • Compreender o funcionamento de diferentes tipos de modelos supervisionados e não-supervisionados
  • Modelos de classificação e modelos de regressão
  • Como prever a procura com regressão linear simples e múltipla 
  • Modelos de classificação com o algoritmo K-nearest neighbours
  • Árvores de decisão e árvores de regressão
  • Algoritmo Random Forest
  • Como avaliar a eficácia dos modelos preditivos

Clustering

  • Identificar segmentos de mercado com os algoritmos k-means e Partinioning Around Medoids (PAM)
  • Avaliação e otimização de algoritmos de clustering

Modelos descritivos

  • Descobrir padrões de comportamento a partir dos dados
  • Conjuntos de itens frequentes
  • Aplicar o algoritmo Apriori em dados transacionais
  • Que produtos se vendem melhor em conjunto?
  • Avaliação de modelos descritivos

Resolução de casos práticos

Recursos

Os formandos deverão trazer o seu computador, com o Excel e o R Studio instalado.

Requisitos

Os formandos deverão ter conhecimentos básicos de linguagens de programação, estatística e/ou análise de dados.

Local, datas e horário

Live Streaming

  • Data: 28 e 30 de Novembro, das 09h00 às 18h00
  • Requisitos: A partir de sua casa, ou do seu local de trabalho, necessita apenas do seu computador portátil, acesso à Internet, uma Webcam e um microfone. Recomendamos o uso de dois ecrãs (o do computador e outro adicional) por forma a facilitar a visualização.

Carga horária

16 horas

Formador

NN1 2

Nuno Nogueira é consultor de business intelligence e analytics em diversas empresas nacionais e internacionais. É fundador e administrador do Portal Gestão e autor do livro  "Power BI para gestão e finanças" da FCA Editora.