Перед вами программа, которая направлена на изучение процесса машинного обучения:
- Сбор данных (Обзор источников данных. Подготовка наборов данных с помощью порталов открытых данных и социальны сетей) - Исследование данных (Визуализация данных. Исследования графов. Интерактивная визуализация) - Моделирование (Модели машинного обучения: регрессия и классификация. Обучение моделей на данных. Оценка точности предсказаний)
К программе прилагаются: видео и презентации по теоретической части, лонгрид по каждой теме, файлы с кодом и подробными комментариями практической части, практические задания.
Первый блок посвящен процессу Data Science. Работа с данными — это важный этап, так как качество машинного обучения зависит от данных, на которых система обучается.
В рамках третьего блока рассмотрим источники данных, такие как порталы открытых данных и социальные сети, а также попрактикуемся в сборе данных. Для этого перейдите в дополнительные материалы.
Четвертых блок посвящен исследованию данных. Этот этап необходим для лучшего понимания данных, чаще всего для этого используют визуализацию. Дополнительных материалах рассмотрим визуализацию графов и интерактивную визуализацию.
Последний блок посвящен моделированию. Рассмотрим процесс машинного обучения, познакомимся с основными моделями (регрессия и классификация) и обучим модель на данных.