Аналитика Big Data для руководителей и менеджеров

IMG_25092017_170731_0

Продолжительность курса — 3 дня

data-analytics

Данный курс предоставляет необходимые знания для участия в проектах по анализу больших данных. Включает информацию о фазах жизненного цикла процессов аналитики больших данных при переходе бизнеса к использованию Big Data. На курсе вы узнаете базовые и расширенные методы аналитики и техники поиска и извлечения знаний из больших массивов разнородных данных. Программа обучения включает сравнение различных версий дистрибутивов платформы Hadoop, облачные сервисы для хранения и аналитики данных, «open source» и коммерческие инструменты, используемые для хранения, обработки, визуализации и аналитики больших данных.

 

Аудитория

Данный курс предназначен для руководителей, менеджеров и специалистов, желающих получить дополнительные знания по инструментам и методам анализа больших данных для участия в проектах больших данных.

Программа курса

Введение в Big Data

  • Большие данные и цифровизация данных
  • Методы аналитики больших данных
  • Отраслевая специфика аналитики больших данных
  • Сценарии применения технологий больших данных
  • Жизненный цикл аналитики данных: получение данных, подготовка данных, планирование модели, построение модели, проверка результатов, внедрение
  • Формирование озера данных Data Lake

Data Mining — извлечение знаний из больших данных

  • Задачи Data Mining
  • Классификация и кластеризация
  • Прогнозирование и визуализация
  • Ассоциативные правила и обнаружение аномалий
  • Методология CRISP-DM
  • Инструменты Data Mining
  • Специфика применения Data Mining для разных отраслей бизнеса с примерами

Машинное обучение для Data mining

  • Основные определения
  • Задачи и область применения машинного обучения
  • Supervised/unsupervised машинное обучение
  • Инструменты и технологии машинного обучения

Data mining в социальных сетях

  • Введение в анализ социальных сетей и теорию графов
  • Базовые алгоритмы на графах и основные возможности графового анализа
  • Феномен маленького мира
  • Выделение важных узлов в социальных сетях
  • Инструменты и методы визуализации графов для применения в бизнесе

Анализ текстов в Data Mining

  • Задачи анализа текста
  • Методы автоматической обработки текстов
  • Специфика обработки больших объемов текстов
  • Sentiment Analysis — определение тональности текста

Инструментарий для работы с Big Data

  • Специфика работы с Big Data
  • Аналитика для неструктурированных данных с использованием Hadoop
  • Назначение и характеристика компонент экосистемы Apache Hadoop для хранения и обработки Big Data (MapReduce, HDFS, YARN, Spark, HBase, Hive, и т.д.)
  • Сравнительный анализ Hadoop дистрибутивов (Аренадата Hadoop, Cloudera, Horton Works, MapR) и инструментарий аналитика данных на примерах использования
  • Сравнительные характеристики программных и аппаратных решений для реализации решений по Big Data
  • Облачные платформы (AWS, EMR, Azure) для реализации решений по Big DataСредства визуализации для аналитики данных

Интеграция Больших данных

  • Основные принципы работы с Big Data
  • Импорт и экспорт данных с Hadoop (SQL, NoSQL, HDFS, NFS, потоковые данные, web content, файлы логов, социальные сети)
  • Пакетная и динамическая загрузка данных

Правовые аспекты организации защиты персональных данных

  • Правовое регулирование в области защиты персональных данных.
  • Международная практика в области защиты персональных данных.
  • Права субъекта и обязанности оператора при обработке персональных данных.
  • Виды нарушений безопасности персональных данных.
  • Стандарт GDRP

С чего начать?

  • Формирование команды проекта Big Data.Ключевые роли.
  • Специфика рынка данных и аналитики.
  • Использование подходов Agile и DevOps
  • Методологии для стандарты
  • Отличия подходов Business Intelligence и Data Science
  • Сравнительные характеристики программных и аппаратных решений для реализации решений по Big Data.
Аналитика Big Data для руководителей и менеджеров
BIG DATA SCIENCE,