Цель курса – развить понимание основных концепций машинного обучения (теория) и дать навыки его использования (практика).
Требуются начальные навыки программирования на Python и знание математики (математический анализ, линейная алгебра, теория вероятностей, математическая статистика) на уровне 2 курса технического ВУЗа.
- Первичный анализ данных с Pandas, лекция
- Визуальный анализ данных с Python, часть 1, часть 2
- Классификация, деревья решений и метод ближайших соседей, лекция
- Линейные модели классификации и регрессии, часть 1, часть 2, часть 3, часть 4, часть 5
- Композиции: бэггинг, случайный лес, часть 1, часть 2, часть 3
- Построение и отбор признаков, лекция
- Обучение без учителя: PCA и кластеризация, часть 1, часть 2, часть 3
- Обучаемся на гигабайтах с Vowpal Wabbit, лекция
- Анализ временных рядов с помощью Python, часть 1, часть 2, часть 3
- Градиентный бустинг, часть 1, часть 2, часть 3, часть 4, часть 5, часть 6, часть 7, часть 8, часть 9, часть 10
- Первичный анализ данных с Pandas
- Визуальный анализ данных с Seaborn и Matplotlib
- Классификация. Деревья решений
- Логистическая регрессия
- Случайный лес
- Регрессия, регуляризация
- Обучение без учителя
- Признаки, SGD, Vowpal Wabbit
- Временные ряды
- Градиентный бустинг
- Анализ данных по доходу населения UCI Adult, задание
- Визуальный анализ данных о публикациях на Хабрахабре, задание
- Деревья решений в игрушечной задаче и на данных Adult репозитория UCI, задание
- Прогнозирование популярности статей на TechMedia (Хабр) с помощью линейных моделей, задание
- Логистическая регрессия и случайный лес в задаче кредитного скоринга, задание
- Линейная регрессия, Lasso и RF-регрессия в задаче по определению качества вина, задание
- Обучение без учителя: метод главных компонент и кластеризация, задание
- Реализация алгоритмов онлайн-обучения, задание
- Анализ временных рядов, задание
- Прогнозирование задержек вылетов, задание