Data Science: Машинное обучение в R

IMG_25092017_170731_0

Продолжительность курса — 5 дней

Данный курс предназначен для изучения алгоритмов машинного обучения с практическим применением техник машинного обучения реализованных в R. Рассматриваются понятия data mining, измерения производительности и уменьшения размерности, регрессионные модели, байесовская модель, SVM и ассоциативные правила для анализа. После успешного завершения данного курса вы сможете понимать и объяснять принципы работы алгоритмов машинного обучения, и применять данные алгоритмы на реальных задачах в больших данных.

Аудитория

Специалисты по работе с большими данными, бизнес аналитики и руководители, желающие получить расширенную теоретическую и практическую подготовку по методам Data Mining для участия в проектах анализа больших данных.

Предварительная подготовка

  • Понимание основ статистики
  • Опыт работы c R-Studio или знания в рамках курса Data Science: Анализ данных и визуализация в R

Программа курса

1. Основы статистики и простая линейная регрессия

  • Что такое ваши данные?
  • Статистические выводы
  • Введение в машинное обучение
  • Простая линейная регрессия
  • Диагностика и трансформация
  • Коэффициент определенности

2. Множественная линейная регрессия и обобщенная линейная модель

  • Множественная линейная регрессия
  • Допущения и диагностика
  • Обобщенные линейные модели
  • Логистическая регрессия
  • Оценка максимального правдоподобия
  • Интерпретация модели
  • Оценка соответствия модели

3. Алгоритм ближайших соседей, наивный байессовский анализ и «проклятие размерности»

  • Алгоритм K-ближайших соседей
  • Выбор К и меры расстояния
  • Условная вероятность: теорема Байеса
  • Оценка Лапласа
  • Уменьшение размерности
  • Процедура PCA
  • Ridge и регрессия Лассо
  • Перекрестная проверка

4. Метод опорных векторов и модели деревьев

  • Деревья решений. Bagging
  • Случайные леса. Boosting
  • Важность переменной
  • Сортировка полей и поддержка векторного классификатора
  • Метод опорных векторов

5. Кластерный анализ и нейронные сети

  • Кластерный анализ
  • K-means кластеризация
  • Иерархическая кластеризация
  • Нейронные сети и персептроны
  • Сигмоидные нейроны
  • Сетевая топология и скрытые функции
  • Метод обратного распространения ошибки с градиентным спуском
Data Science: Машинное обучение в R
BIG DATA SCIENCE,