Описание Услуги
Примечание: с 1 января 2019 года данный курс проводится в объединеном формате по дистрибутивам Hadoop версии 2 компаний Cloudera/HortonWorks/ArenaData на выбор для пользователей. Для корпоративного формата обучения возможна выделенная программа по одной версии дистрибутива Hadoop (по запросу).
Данный курс содержит базовую сведения по установке и настройке кластер Hadoop, выполнению основных операций в файловой системе HDFS, запуска задач MapReduce, основам управления ресурсами Hadoop с помощью планировщика задач YARN и знакомит слушателей с концепциями использования Hadoop и компонент экосистемы Hadoop (MapReduce, Apache Hive, Apache Pig, Apache Flume, Apache Sqoop и Apache Spark) для организации хранения больших данных и процессинга.
Курс построен на сквозных практических примерах с тренировочными наборами данных, для запуска batch и потоковых задач в Hadoop кластере развернутого в облчаной инфраструктуре Amazone Web Services с использованием дистрибутивов Cloudera Distributed Hadoop, HortonWorks HDP или ArenaData Hadoop , а также программного обеспечения управления кластером Cloudera Manager или Apache Ambari.