Data Science: Анализ данных и визуализация в R

IMG_25092017_170731_0

Продолжительность курса — 5 дней

Данный курс является необходимым для получения практических навыков работы с R и R-Studio. В процессе обучения слушатели узнают, как загружать, сохранять и преобразовывать данные, а также как писать функции, создавать графики и сопоставлять базовые статистические модели с данными. В дополнение к изучению теоретических основ процесса анализа данных, этот курс фокусируется на практических инструментах, необходимых для анализа и визуализации больших данных. По окончании курса слушатели овладеют основными навыками обработки, манипулирования и анализа данных различных типов, навыками создания отчетов и документирования кода.

Аудитория

Специалисты по работе с большими данными, бизнес аналитики и руководители, желающие получить расширенную теоретическую и практическую подготовку по использованию RStudio в проектах анализа больших данных.

Предварительный уровень подготовки:

  • Понимание основ статистики;
  • Базовый опыт работы с языками программирования или скриптами.

Программа курса

1. Основы статистики и простая линейная регрессия

  • Что такое ваши данные
  • Статистические выводы
  • Введение в машинное обучение
  • Простая линейная регрессия
  • Диагностика и трансформация
  • Коэффициент определенности

2. Базовое программирование с R

  • Введение в R. Что такое R?
  • R-Studio, пакеты и рабочая область
  • Основные элементы языка R
  • Типы объектов данных. Локальный импорт / экспорт данных
  • Введение функций и управляющих операторов
  • Углубленное изучение объектов данных
  • Функции. Программирование функций

3. Базовые элементы данных

  • Преобразование данных (Reshape, Split, Combine)
  • Символы. Обработка строк. Даты и временные метки
  • Сбор Веб-данных
  • API источники данных
  • Подключение к внешней базе данных

4. Манипулирование данными с помощью «dplyr»

  • Подмножество, преобразование и переупорядочение наборов данных
  • Объединение наборов данных
  • Групповые операции над наборами данных

5. Графика данных и визуализация данных

  • Основные подходы к визуализации данных и графики данных. Base, Grid, Lattice, ggplot2
  • Построение графиков больших данных с ggplot2

6. Расширенная визуализация в R

  • Настраиваемая графика с помощью ggplot2
  • Титулы, системы координат, масштабы, темы, метки, легенда scatterplot с многоразмерными данными, визуализация временной последовательности, карты
  • Интерактивная визуализация в R.
Data Science: Анализ данных и визуализация в R
BIG DATA SCIENCE,