IMPA: Cloudera Impala Data Analytics

IMG_25092017_170731_0

Продолжительность курса — 1 день

1.    Введение в Cloudera Impala

  • Введение в ClouderaImpala: архитектура и компоненты.
  • Impalaсинтаксис, типы данных, написание запросов, загрузка данных, использование Hive Metastore.
  • Лабораторная работа.

2.    Интеграция Cloudera Impala

  • Загрузка данных в таблицы Запросы черезHBase.
  • Оптимизации производительности с использование Partition, Buckets.
  • Форматы файлов для Cloudera Impala(ParquetORC).

3.    Оптимизация Impala запросов

  • Сравнение JOIN операций для исполнения инструментами экосистемы Hadoop.
  • Map JOIN. Comon JOIN. Skewed JOIN. Collocated JOIN.
  • Оптимизация запросов.

4.    Сценарии применения Impala

IMPA: Cloudera Impala Data Analytics
BIG DATA SCIENCE,