Задания и материалы в рамках программы DS от Нетологии

1. Введение в data science и инструменты

Навыки по итогам блока:

алгоритмы классификации: линейные, деревья принятия решений, kNN;
логическая регрессия;
алгоритмы кластеризации;
оценка точности модели, отношение между смещением и дисперсией(bias-variance tradeoff), подбор метода оценки точности для задачи;
обучение модели: градиентный спуск, МНК, другие на усмотрение преподавателя;
переобучение, его влияние на точность и способы повышения точности: усложнение, регуляризация, ансамблирование.

1.1. Введение, обзор DS и ML

Что такое DS, ML, классы решаемых задач, большие данные и параллельные вычисления. Подходы к обучению машин: с учителем и без. Обзор программы курса.

1.2. Python, git

Установка Python, Jupyter Notebook.Введение в Python: синтаксис, основные элементы, типы данных. Основы работыс git. Введение в numpy, pandas. Базовый эксплоративный анализ и визуализация данных на pandas.

1.3. Мастер-класс визуализации данных на Python

Визуализация на matplotlib,seaborn, plotly.

1.4. Обзор базовых алгоритмов ML в sklearn

Обзор библиотеки sklearn. Семейства алгоритмов: классификация, регрессия, кластеризация, уменьшение размерности данных. Обучение на маленьких больших датасетах.

1.5. Вычисления на кластере, MapReduce, Hadoop

Необходимость в кластерных вычислениях. Парадигма MapReduce. Инструменты работы с большими данными. Hadoop, Spark, обзор других компонентов экосистемы. Spark —как один из самых востребованных инструментов для распределённых вычислений.

1.6. Настройка учебного кластера Hadoop на Azure

Средства MS Azure для машинного обучения, хранения и анализа данных. Развертывание кластера Hadoop/Spark в облаке Azure. Выполнение учебных примеров на кластере.

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
1.3		1.3
4. Recommender systems		4. Recommender systems
5. CV and NN		5. CV and NN
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Задания и материалы в рамках программы DS от Нетологии

1. Введение в data science и инструменты

Навыки по итогам блока:

1.1. Введение, обзор DS и ML

1.2. Python, git

1.3. Мастер-класс визуализации данных на Python

1.4. Обзор базовых алгоритмов ML в sklearn

1.5. Вычисления на кластере, MapReduce, Hadoop

1.6. Настройка учебного кластера Hadoop на Azure

About

Uh oh!

Releases

Packages

Languages

Skaarj7/netology

Folders and files

Latest commit

History

Repository files navigation

Задания и материалы в рамках программы DS от Нетологии

1. Введение в data science и инструменты

Навыки по итогам блока:

1.1. Введение, обзор DS и ML

1.2. Python, git

1.3. Мастер-класс визуализации данных на Python

1.4. Обзор базовых алгоритмов ML в sklearn

1.5. Вычисления на кластере, MapReduce, Hadoop

1.6. Настройка учебного кластера Hadoop на Azure

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages