IMPA: Cloudera Impala Data Analytics
Продолжительность курса — 1 дней
Описание Услуги
IMPA: Cloudera Impala Data Analytics
02. Интеграция Cloudera Impala
- Загрузка данных в таблицы Запросы через HBase.
- Оптимизации производительности с использование Partition, Buckets.
- Форматы файлов для Cloudera Impala (Parquet, ORC).
03. Оптимизация Impala запросов
- Сравнение JOIN операций для исполнения инструментами экосистемы Hadoop.
- Map JOIN. Comon JOIN. Skewed JOIN. Collocated JOIN.
- Оптимизация запросов.