Skip to content

Skaarj7/netology

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Задания и материалы в рамках программы DS от Нетологии

1. Введение в data science и инструменты

Навыки по итогам блока:

  • алгоритмы классификации: линейные, деревья принятия решений, kNN;
  • логическая регрессия;
  • алгоритмы кластеризации;
  • оценка точности модели, отношение между смещением и дисперсией(bias-variance tradeoff), подбор метода оценки точности для задачи;
  • обучение модели: градиентный спуск, МНК, другие на усмотрение преподавателя;
  • переобучение, его влияние на точность и способы повышения точности: усложнение, регуляризация, ансамблирование.

1.1. Введение, обзор DS и ML

Что такое DS, ML, классы решаемых задач, большие данные и параллельные вычисления. Подходы к обучению машин: с учителем и без. Обзор программы курса.

1.2. Python, git

Установка Python, Jupyter Notebook.Введение в Python: синтаксис, основные элементы, типы данных. Основы работыс git. Введение в numpy, pandas. Базовый эксплоративный анализ и визуализация данных на pandas.

1.3. Мастер-класс визуализации данных на Python

Визуализация на matplotlib,seaborn, plotly.

1.4. Обзор базовых алгоритмов ML в sklearn

Обзор библиотеки sklearn. Семейства алгоритмов: классификация, регрессия, кластеризация, уменьшение размерности данных. Обучение на маленьких больших датасетах.

1.5. Вычисления на кластере, MapReduce, Hadoop

Необходимость в кластерных вычислениях. Парадигма MapReduce. Инструменты работы с большими данными. Hadoop, Spark, обзор других компонентов экосистемы. Spark —как один из самых востребованных инструментов для распределённых вычислений.

1.6. Настройка учебного кластера Hadoop на Azure

Средства MS Azure для машинного обучения, хранения и анализа данных. Развертывание кластера Hadoop/Spark в облаке Azure. Выполнение учебных примеров на кластере.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published