Treinamento PrestoDB - SQL query engine

Sobre o Treinamento.

Este treinamento capacita os alunos para com o Software PrestoDB. O Presto é um mecanismo de consulta distribuído para BIG DATA usando a linguagem de consulta SQL. Sua arquitetura permite que os usuários consultem fontes de dados como Hadoop, Cassandra, Kafka, AWS S3, Alluxio, MySQL, MongoDB e Teradata, e permite o uso de várias fontes de dados em uma consulta.

O que vou aprender?

Ao final deste treinamento você será capaz de:

Empregar Presto conceitos-chave para otimizar os sistemas de BIG DATA modernos.
Executar armazéns de escala de exabyte.
Clone os dados para um sistema de armazenamento de dados proprietário.
Configurar os principais recursos do PrestoDB.
Utilizar as opções da interface do usuário do PrestoDB.
Connectar-se com Ferramentas de Visualização.

Público-alvo.

Este treinamento é direcionado para as seguintes profissionais:

Engenheiros de infraestrutura de BIG DATA.
Engenheiro de Dados.
Desenvolvedores.
Cientistas de Dados.

Dificuldade.

Intermediário.

Aplicabilidade.

Este treinamento foi desenvolvido usando o PrestoDB 0.254 e foi modificado pela última vez em 02 de Março de 2023.

Conteúdo Programático

Introdução e conceituais.

SQL ANSI.
Query Engines.
O que é o PrestoDB.
Arquitetura do PrestoDB.
Recursos e benefícios do PrestoDB.
Comparação com outras ferramentas de processamento de dados.
Licenciamento (Free Software X Open Source).
Empresas usando PrestoDB no mundo.
Empresas usando PrestoDB no Brasil.
Versões do PrestoDB.
Comunidade PrestoDB no Brasil e no Mundo.
Casos de Uso.
Livros, sites, documentação e referências complementares.

Instalação e Configuração.

Requisitos de hardware e software.
Instalação do PrestoDB em diferentes sistemas operacionais.
Configuração básica do PrestoDB.

Modelagem de Dados e Consultas

SQL Statement Syntax.
Tipos de dados suportados pelo PrestoDB.
Modelagem de dados no PrestoDB.
Consultas SQL básicas no PrestoDB.
Consultas SQL avançadas no PrestoDB.
Consultas distribuídas no PrestoDB.
Filtrando dados.
Migrando fontes de dados.
Trabalhando com bandas de bolllinger.
Benchmarking com TCHP.
Trabalhando com conectores.

Administração e Gerenciamento de Cluster

Web Interface.
Tuning Presto.
Properties Reference.
Conceitos de gerenciamento de cluster no PrestoDB.
Configuração de um cluster PrestoDB.
Adição e remoção de nós do cluster.
Monitoramento e solução de problemas do cluster.

Integração com outras Ferramentas

Driver JDBC para PrestoDB.
Integração com ferramentas de armazenamento de dados, como Hadoop HDFS, Amazon S3, Minio, e outros
Integração com ferramentas de processamento de dados, como Apache Spark e Apache Flink.
Integração com ferramentas de Business Intelligence e ETL (Pentaho, Hop).

Segurança

Configuração de segurança.
Password File Authentication.
Authorization.

API

HTTP Connector
Presto Client REST API.
Presto Worker REST API.
SerializedPage Wire Format.

Uso Avançado

Uso de funções personalizadas no PrestoDB.
Uso de UDFs (User-Defined Functions) no PrestoDB.
Uso de recursos avançados de segurança, como a criptografia de dados.
Uso do PrestoDB em ambientes de produção.

Práticas recomendadas

Melhores práticas para modelagem de dados e consultas no PrestoDB.
Melhores práticas para gerenciamento de cluster no PrestoDB.
Melhores práticas para integração com outras ferramentas.
Melhores práticas para uso avançado do PrestoDB.

Carga Horária.

24 Horas.

Modalidade do Treinamento.

In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.

Pré-requisitos.

Este treinamento pressupõe que o aluno seja competente com as seguintes ferramentas, tecnologias e conceitos:

Conhecimento básico em desenvolvimento Java.
Conhecimento básico em arquitetura de microsserviços.

Requisitos:

Todos os participantes devem trazer um notebook para realizar as atividades práticas.
O Computador deve estar com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 12 alunos para um melhor desempenho.

Requisitos Recomendados de Hardware.

Memória RAM: 8GB.
Espaço em Disco: 20GB.
Processador: 64 bits (chipsts de x64).
CPU: 2 núcleos.
Sistemas Operacionais: GNU/Linux, Windows ou MacOS.
VirtualBox.

Material.

Serão disponibilizados os seguintes materiais aos alunos do treinamento:

Todos os softwares PrestoDB e acessórios na sua última versão estável.
Material próprio em Português do Brasil.
Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
Apostilas digitais dos softwares desenvolvidas pela Ambiente Livre.
Apostilas com exercícios práticos desenvolvidos no treinamento.
Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
Brindes: Caneta, Pasta e Bloco de Anotações (somente em presenciais).

Metodologia.

O treinamento apresenta uma empresa fictícia que necessita analisar dados de suas áreas e todas as fases da implantação.
Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.

Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos PrestoDB e cursos PrestoDB. caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.

Inscrições, Informações e Valores

Diferenciais da Ambiente Livre.

A Ambiente Livre tem 19 anos no mercado, pioneirismo na oferta de consultoria, treinamentos, projetos e suporte em softwares de código-fonte aberto e software livre com um ecossistema voltado a negócios, e pode lhe ajudar a gerir complexidades, reduzir custos, permitindo adaptar e oferecer inovação inteligente necessária para o seu sucesso.

3.535 profissionais capacitados em 325 turmas ministradas.

Atuação global, 807 empresas impactadas em projetos, consultorias e treinamentos no Brasil, América Latina, Europa e África.

Networking entre profissionais, comunidades e startups de tecnologias Open Source e Free Software.

Treinamentos baseados em experiência de projetos e consultorias, 2.230 tutorais documentados, atualizados e disponibilizado de forma vitalícia em EAD.

Empresa 100% focada em Open Source e Free Software e contribuidora com equipe atuante nos projetos e eventos de código aberto e software livre.

Apoio na criação de 4 startups / Spin-off baseadas em soluções Open Source ou Free Software.

Instrutor

Marcio Junior Vieira

22 anos de experiência em informática, vivência em desenvolvimento e análise de sistemas de gestão empresarial e ciência de dados.
CEO da Ambiente Livre atuando como Cientista de Dados, Engenheiro de Dados e Arquiteto de Software.
Professor dos MBAs em Big Data & Data Science, Inteligência Artificial e Business Intelligence da Universidade Positivo.
Professor de BPM no MBA de Business Intelligence da Universidade Positivo.
Professor do MBA Artificial Intelligence e Machine Learning da FIAP.
Pesquisador pela Universidade de Brasília no Laboratório de Tecnologias da Tomada de Decisão - UnB/LATITUDE.
Graduado em Tecnologia em Informática(2004) e pós-graduado em Software Livre(2005) ambos pela UFPR.
Palestrante FLOSS em: FISL, The Developes Conference, Latinoware, Campus Party, Pentaho Day, Ticnova, PgDay e FTSL.
Organizador Geral: Pentaho Day 2017, 2015, 2019 e apoio nas ed. 2013 e 2014.
Data Scientist, instrutor e consultor de Big Data e Data Science com tecnologias abertas.
Ajudou a capacitar equipes de Big Data na IBM, Accenture, Tivit, Sonda, Serpro, Dataprev, Natura, MP, Netshoes, Embraer entre outras.
Especialista em implantação e customização de Big Data com Hadoop, Spark, Pentaho, Cassandra e MongoDB.
Contribuidor de projetos open sources ou free software internacionais, tais como Pentaho, Apache Hop, LimeSurvey, SuiteCRM e Camunda.
Especialista em implantação e customização de ECM com Alfresco e BPM com Activiti, Flowable e Camunda.
Certificado (Certified Pentaho Solutions) pela Hitachi Vantara (Pentaho inc).
Ganhou o prêmio Camunda Champion em 2022 em reconhecimento a suas contribuições com o projeto Open Source Camunda.
Membro da The Order Of de Bee (Comunidade Alfresco trabalhando para desenvolver o ecossistema Alfresco independente)

PrestoDB