PrestoDB

Treinamento PrestoDB - SQL query engine

Sobre o Treinamento.

Este treinamento capacita os alunos para com o Software PrestoDB. O Presto é um mecanismo de consulta distribuído para BIG DATA usando a linguagem de consulta SQL. Sua arquitetura permite que os usuários consultem fontes de dados como Hadoop, Cassandra, Kafka, AWS S3, Alluxio, MySQL, MongoDB e Teradata, e permite o uso de várias fontes de dados em uma consulta.

O que vou aprender?

Ao final deste treinamento você será capaz de:

  • Empregar Presto conceitos-chave para otimizar os sistemas de BIG DATA modernos.
  • Executar armazéns de escala de exabyte.
  • Clone os dados para um sistema de armazenamento de dados proprietário.
  • Configurar os principais recursos do PrestoDB.
  • Utilizar as opções da interface do usuário do PrestoDB.
  • Connectar-se com Ferramentas de Visualização.

Público-alvo.

Este treinamento é direcionado para as seguintes profissionais:

  • Engenheiros de infraestrutura de BIG DATA.
  • Engenheiro de Dados.
  • Desenvolvedores.
  • Cientistas de Dados.

Dificuldade.

Intermediário.

Aplicabilidade.

Este treinamento foi desenvolvido usando o PrestoDB 0.254 e foi modificado pela última vez em 02 de Março de 2023.

Conteúdo Programático

Introdução e conceituais.

  • SQL ANSI.
  • Query Engines.
  • O que é o PrestoDB.
  • Arquitetura do PrestoDB.
  • Recursos e benefícios do PrestoDB.
  • Comparação com outras ferramentas de processamento de dados.
  • Licenciamento (Free Software X Open Source).
  • Empresas usando PrestoDB no mundo.
  • Empresas usando PrestoDB no Brasil.
  • Versões do PrestoDB.
  • Comunidade PrestoDB no Brasil e no Mundo.
  • Casos de Uso.
  • Livros, sites, documentação e referências complementares.

Instalação e Configuração.

  • Requisitos de hardware e software.
  • Instalação do PrestoDB em diferentes sistemas operacionais.
  • Configuração básica do PrestoDB.

Modelagem de Dados e Consultas

  • SQL Statement Syntax.
  • Tipos de dados suportados pelo PrestoDB.
  • Modelagem de dados no PrestoDB.
  • Consultas SQL básicas no PrestoDB.
  • Consultas SQL avançadas no PrestoDB.
  • Consultas distribuídas no PrestoDB.
  • Filtrando dados.
  • Migrando fontes de dados.
  • Trabalhando com bandas de bolllinger.
  • Benchmarking com TCHP.
  • Trabalhando com conectores.

Administração e Gerenciamento de Cluster

  • Web Interface.
  • Tuning Presto.
  • Properties Reference.
  • Conceitos de gerenciamento de cluster no PrestoDB.
  • Configuração de um cluster PrestoDB.
  • Adição e remoção de nós do cluster.
  • Monitoramento e solução de problemas do cluster.

Integração com outras Ferramentas

  • Driver JDBC para PrestoDB.
  • Integração com ferramentas de armazenamento de dados, como Hadoop HDFS, Amazon S3, Minio, e outros
  • Integração com ferramentas de processamento de dados, como Apache Spark e Apache Flink.
  • Integração com ferramentas de Business Intelligence e ETL (Pentaho, Hop).

Segurança

  • Configuração de segurança.
  • Password File Authentication.
  • Authorization.

API

  • HTTP Connector
  • Presto Client REST API.
  • Presto Worker REST API.
  • SerializedPage Wire Format.

Uso Avançado

  • Uso de funções personalizadas no PrestoDB.
  • Uso de UDFs (User-Defined Functions) no PrestoDB.
  • Uso de recursos avançados de segurança, como a criptografia de dados.
  • Uso do PrestoDB em ambientes de produção.

Práticas recomendadas

  • Melhores práticas para modelagem de dados e consultas no PrestoDB.
  • Melhores práticas para gerenciamento de cluster no PrestoDB.
  • Melhores práticas para integração com outras ferramentas.
  • Melhores práticas para uso avançado do PrestoDB.

Carga Horária.

  • 24 Horas.

Modalidade do Treinamento.

  • In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.

Pré-requisitos.

Este treinamento pressupõe que o aluno seja competente com as seguintes ferramentas, tecnologias e conceitos:

  • Conhecimento básico em desenvolvimento Java.
  • Conhecimento básico em arquitetura de microsserviços.

Requisitos:

  • Todos os participantes devem trazer um notebook para realizar as atividades práticas.
  • O Computador deve estar  com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
  • Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 12 alunos para um melhor desempenho.

Requisitos Recomendados de Hardware.

  • Memória RAM: 8GB.
  • Espaço em Disco: 20GB.
  • Processador: 64 bits (chipsts de x64).
  • CPU: 2 núcleos.
  • Sistemas Operacionais: GNU/Linux, Windows ou MacOS.
  • VirtualBox.

Material.

Serão disponibilizados os seguintes materiais aos alunos do treinamento:

  • Todos os softwares PrestoDB e acessórios na sua última versão estável.
  • Material próprio em Português do Brasil.
  • Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
  • Apostilas digitais dos softwares desenvolvidas pela Ambiente Livre.
  • Apostilas com exercícios práticos desenvolvidos no treinamento.
  • Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
  • Brindes: Caneta, Pasta e Bloco de Anotações (somente em presenciais).

Metodologia.

  • O treinamento apresenta uma empresa fictícia que necessita analisar dados de suas áreas e todas as fases da implantação.
  • Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.

Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos PrestoDB e cursos PrestoDB. caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.

Inscrições, Informações e Valores

Powered by BreezingForms


Diferenciais da Ambiente Livre.

A Ambiente Livre tem 19 anos no mercado, pioneirismo na oferta de consultoria, treinamentos, projetos e suporte em softwares de código-fonte aberto e software livre com um ecossistema voltado a negócios, e pode lhe ajudar a gerir complexidades, reduzir custos, permitindo adaptar e oferecer inovação inteligente necessária para o seu sucesso.

3.535 profissionais capacitados em 325 turmas ministradas.

Atuação global, 807 empresas impactadas em projetos, consultorias e treinamentos no Brasil, América Latina, Europa e África.

Networking entre profissionais, comunidades e startups de tecnologias Open Source e Free Software.

Treinamentos baseados em experiência de projetos e consultorias, 2.230 tutorais documentados, atualizados e disponibilizado de forma vitalícia em EAD.

Empresa 100% focada em Open Source e Free Software e contribuidora com equipe atuante nos projetos e eventos de código aberto e software livre.

Apoio na criação de 4 startups / Spin-off baseadas em soluções Open Source ou Free Software.

Instrutor

Marcio Junior Vieira

  • 22 anos de experiência em informática, vivência em desenvolvimento e análise de sistemas de gestão empresarial e ciência de dados.
  • CEO da Ambiente Livre atuando como Cientista de Dados, Engenheiro de Dados e Arquiteto de Software.
  • Professor dos MBAs em Big Data & Data Science, Inteligência Artificial e Business Intelligence da Universidade Positivo.
  • Professor de BPM no MBA de Business Intelligence da Universidade Positivo.
  • Professor do MBA Artificial Intelligence e Machine Learning da FIAP.
  • Pesquisador pela Universidade de Brasília no Laboratório de Tecnologias da Tomada de Decisão - UnB/LATITUDE.
  • Graduado em Tecnologia em Informática(2004) e pós-graduado em Software Livre(2005) ambos pela UFPR.
  • Palestrante FLOSS em: FISL, The Developes Conference, Latinoware, Campus Party, Pentaho Day, Ticnova, PgDay e FTSL.
  • Organizador Geral: Pentaho Day 2017, 2015, 2019 e apoio nas ed. 2013 e 2014.
  • Data Scientist, instrutor e consultor de Big Data e Data Science com tecnologias abertas.
  • Ajudou a capacitar equipes de Big Data na IBM, Accenture, Tivit, Sonda, Serpro, Dataprev, Natura, MP, Netshoes, Embraer entre outras.
  • Especialista em implantação e customização de Big Data com Hadoop, Spark, Pentaho, Cassandra e MongoDB.
  • Contribuidor de projetos open sources ou free software internacionais, tais como Pentaho, Apache Hop, LimeSurveySuiteCRM e Camunda.
  • Especialista em implantação e customização de ECM com Alfresco e BPM com ActivitiFlowable e Camunda.
  • Certificado (Certified Pentaho Solutions) pela Hitachi Vantara (Pentaho inc).
  • Ganhou o prêmio Camunda Champion em 2022 em reconhecimento a suas contribuições com o projeto Open Source Camunda.
  • Membro da The Order Of de Bee (Comunidade Alfresco trabalhando para desenvolver o ecossistema Alfresco independente)

Últimos posts de Marcio Junior Vieira

Log in